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PRÉFACE 


Cette édition a préservé ses qualités pédagogiques tout en améliorant sa 
présentation matérielle. Nous y retrouverons les points forts et les 
caractéristiques qui en ont assuré le succès au cours des nombreuses 
années. 


On retrouvera une approche basée sur l'étude et l'analyse de situations 
concrètes dont le fil conducteur demeure l'idée de test d'hypothèse. En 
introduisant le test d'hypothèse dès le début du livre par un premier 
contact avec le khi-deux, nous évitons le piège de le reléguer à la fin du 
parcours didactique. Omniprésente aussi, du moins en filigrane, la notion 
de modélisation, l'âme même de toute application des mathématiques, et 
particulièrement de la statistique. 


Rappelons enfin que ce manuel est résolument orienté vers l'apprentissage 
de la statistique. La mise en évidence des mécanismes du raisonnement 
statistique est privilégiée, et ne sont abordés que les sujets et les 
développements mathématiques nécessaires. 


Nous avons cru utile de proposer - ou de rendre possibles - certains choix 
de cheminements et donc d'inclure certains éléments intéressants pour les 
applications et dont on peut donner un traitement élémentaire. Ainsi, on 
trouvera, en fin de manuel, un chapitre consacré aux techniques de 
sondages et un autre aux séries chronologiques. 


Ce manuel permettra donc aux étudiantes et étudiants tant de niveau 
collégial qu'universitaire de découvrir l'univers fascinant de la statistique. 
Et, à travers les très nombreux exercices, ils se familiariseront avec les 
méthodes et les applications innombrables de cette discipline. 


Remerciements à Michel Adès, Gérard Leduc et Glenn Shorrock pour la 
première et la deuxième édition, et à Monsieur François Goulet pour sa 
lecture de l'édition précédente. 


Note Nous avons marqué d'un astérisque certains exercices demandant un 
développement mathématique un peu plus avancé pour celles et ceux 
désirant pousser leurs limites. 
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2 Introduction à la statistique appliquée 


1.1 


Exemple 1 


POPULATION ET VARIABLES 


L'objectif principal de la statistique est de fournir de l'information 
quantitative sur un ensemble circonscrit et bien déterminé d'êtres ou 
d'objets appelés unités statistiques. L'ensemble de ces unités statistiques est 
appelé population. 


Chacun des ensembles suivants peut être considéré comme une population, 
dont l'étude intéressera, selon le cas, divers utilisateurs de la statistique : 


a) l'ensemble de tous les habitants du Québec ; 
b) l'ensemble de tous les ménages de la ville de Laval ; 


c) l'ensemble des entreprises industrielles des Cantons de l'Est, qui 
emploient moins de cent personnes ; 


d) l'ensemble de tous les saumons qui sont venus frayer dans les eaux du 
Québec en 1989 ; 


e) l'ensemble des cotes à la fermeture quotidienne de la bourse de Toronto, 
pour les valeurs minières, en avril et mai 1990 ; 


f) l'ensemble des moustiques des forêts québécoises, en juin 1990. + 


Une population peut être finie, si elle comprend un nombre fini d'unités, ou 
infinie si elle en comprend un nombre infini. Dans l'exemple 1 ci-dessus, la 
population f) peut être considérée comme infinie, même si, en réalité, elle est 
sûrement finie. 


Variables Comme on voit dans les divers cas présentés à l'exemple 1, une 
étude statistique doit nécessairement se limiter à certains aspects, ou 
caractères, des membres de la population, qu'on appelle généralement 
variables. Dès qu'une variable d'une population est choisie, à chaque 
membre de cette population correspond une valeur de la variable en 
question. 


Exemple 2 


Exemple 3 
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Revenons à l'exemple 1 a), où l'on étudie l'ensemble de tous les habitants du 


Québec, et choisissons d'y considérer le caractère « langue maternelle ». 
Alors 


a) une unité statistique est un habitant du Québec ; 
b) la population est l'ensemble de ces habitants ; 
c) la variable est la langue maternelle ; 


d) les valeurs possibles de la variable sont « français », « anglais », « italien », 
« grec », etc. ° 


Dans la même population qu'à l'exemple 2, on peut s'intéresser à diverses 
autres variables. En voici trois : 


a) la variable « revenu brut en dollars pour 1999 » aura comme valeurs 
possibles des nombres qui vont de zéro à quelques millions ; 


b) la variable « nombre de livres lus durant les douze derniers mois » aura 
comme valeurs possibles des nombres de 0 à plusieurs dizaines ; 


c) la variable « la boisson préférée » aura comme valeurs possibles : « lait », 
« thé », « café », « eau », « bière », « vin », etc. + 


Aussi bien pour des motifs pédagogiques que pour des fins purement 
techniques, nous distinguons différentes sortes de variables, telles 
qu'indiquées sur le schéma suivant. 


qualitatives 


variables 


discrètes 


quantitatives 


continues 


Une variable est dite qualitative ou quantitative selon que ses valeurs 
représentent des qualités ou des quantités. La variable « langue maternelle » 
est qualitative, tandis que les variables « taille du ménage » et « revenu 
annuel brut » sont quantitatives. Cette distinction n'est pas toujours absolue 
et parfois se réfère non pas à la nature d'une variable mais plutôt à la façon 
dont elle est traitée. Le revenu d'une entreprise est une variable quantitative, 
mais si on se contente de le classer comme « nul », « faible », « moyen » et 
« élevé », alors on en fait une variable qualitative. 
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Nous ferons une deuxième distinction, celle-ci entre deux sortes de variables 
quantitatives : les variables discrètes et les variables continues. Une 
variable discrète est une variable qui ne peut prendre que des valeurs 
isolées. La variable « nombre d'enfants » dans une famille est une variable 
discrète, car elle ne peut prendre comme valeurs que les entiers O, 1, 2, … ; 
aucune valeur entre ces entiers n'est possible. La valeur « pointure des 
souliers » est, elle aussi, une variable discrète, même si les demi-pointures 
existent. Une pointure de 6 1/2 existe, mais il n'y a pas de pointure entre 
6 1/2 et 7 ou entre 7 et 7 1/2. 


Contrairement aux variables discrètes, les variables continues peuvent 
théoriquement prendre comme valeurs tous les nombres compris dans un 
certain intervalle. La taille d'une personne, par exemple, peut être de 165 cm 
ou de 166 cm, mais elle peut également être de 165,5 cm ou de 165,487 3 cm. 
Cette notion est évidemment théorique puisque les instruments de mesure 
usuels ne nous permettent pas de distinguer une personne de 165,487 3 cm 
d'une personne de 165,487 4 cm. En pratique, on mesure les tailles en 
arrondissant à l'entier le plus proche et les données prennent la même allure 
que celles qu'on obtiendrait d'une variable discrète. Néanmoins, les variables 
continues sont en général traitées différemment des variables discrètes du fait 
que leurs valeurs possibles, réalisées ou pas, sont très nombreuses. De plus, 
la signification des nombres dans le cas continu est différente : lorsqu'on 
inscrit 165 cm pour la taille de quelqu'un, il est entendu que sa « vraie » taille 
n'est pas 165,000 O cm mais qu'elle se situe quelque part entre 164,5 cm et 
165,5 cm. Les conséquences pratiques de la distinction entre une variable 
continue et une variable discrète apparaîtront dans les chapitres suivants. 


1.2 


DISTRIBUTIONS 


Les données brutes, dans la forme où elles se présentent à la suite d'une 
enquête, sont en général impossibles à assimiler. Aussi, la première étape 
d'une analyse de ces données consiste à les rassembler, à les résumer et à 
les présenter sous une forme compréhensible, de façon à avoir une première 
vue d'ensemble de l'information qu'elles contiennent. 


Supposons, par exemple, que pour évaluer l'opportunité de construire un 
petit centre commercial dans un certain quartier, on procède à une enquête 
auprès des 770 ménages du quartier. Un interviewer se présente à chacun 
des ménages avec un questionnaire contenant des questions comme : 
Combien y a-t-il de personnes dans le ménage ? Combien de celles-ci sont 
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des adultes ? Combien ont un emploi ? Quel est votre revenu familial ? 
Avez-vous une automobile ? Où faites-vous vos emplettes habituellement ? 
Chacune de ces questions correspond à une variable. Le résultat immédiat 
de cette enquête est une pile de 770 fiches. Une version simplifiée d'une de 
ces fiches ressemblerait à l'illustration de la figure 1.1. 


En transcrivant l'information contenue dans ces 770 fiches, on peut con- 
struire un immense tableau où chaque ligne représente un ménage et 
chaque colonne une variable. Ce tableau aurait sans doute l'allure du 


tableau 1.1. 
FIGURE 1.1 Enquête sur les ménages du quartier X 
MÉNAGE No 
1. nombre de personnes 
2. nombre d'adultes 
3. nombre de personnes ayant un emploi 
4. revenu familial ($) : 
[]0 - moins de 25 000 
[125 000 ou plus - moins de 45 000 
[145 000 ou plus 
TABLEAU 1.1 Données brutes sur les ménages du quartier X 
Ménage Question 
no 1 2 3 4 
1 1 1 2 
2 2 1 1 1 
3 2 2 1 3 
4 4 2 2 3 
770 3 2 4 2 


Le tableau 1.1 présente donc, pour la population formée des 770 ménages 
d'un certain quartier, l'information complète sur quatre variables, les trois 
premières étant quantitatives discrètes, et la quatrième, qualitative. Plus 
loin, nous verrons comment examiner simultanément plusieurs variables, 
mais pour commencer, nous les prenons une à la fois. 
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TABLEAU 1.2 


TABLEAU 1.3 


Considérons la première, « nombre de personnes ». L'information sur cette 
variable est à la deuxième colonne du tableau, dans laquelle on trouvera, 
pêle-mêle, des « 1 », des « 2 », des « 3 », etc. Mais l'information contenue dans 
ces 770 chiffres peut être résumée dans un tableau comme le tableau 1.2. 


Distribution du nombre de personnes dans 770 ménages 


Nombre de 
1 2 3 4 5 6+ TOTAL 
personnes 
Effectif 125 200 295 100 50 0 770 


Ce tableau est un exemple d'une distribution. Une distribution énumère les 
valeurs distinctes de la variable (ici la variable est le nombre de personnes et 
ses valeurs sont 1, 2, 3, 4, et 5), et fait correspondre à chaque valeur de la 
variable l'effectif, c'est-à-dire le nombre d'éléments de la population pour 
lesquels la variable prend la valeur donnée. Ainsi, il y a 125 ménages d'une 
personne, 200 ménages de 2 personnes, 295 ménages de 3 personnes, 100 
ménages de 4 personnes et 50 ménages de 5 personnes. 


L'effectif total est la somme des effectifs, soit la taille de la population. 


Fréquences Dans une distribution, l'effectif est parfois remplacé par la 
fréquence, c'est-à-dire le rapport de l'effectif à l'effectif total. Le tableau 1.3 
donne la même distribution que le tableau 1.2, exprimée en fréquences. Une 
fréquence, lorsqu'elle est multipliée par 100, devient un pourcentage. Elle a 
l'avantage de se lire plus aisément lorsque les effectifs sont grands. De plus, 
on ne peut comparer deux distributions avec des effectifs totaux différents 
que si elles sont exprimées en fréquences. 


Distribution du nombre de personnes dans 770 ménages 


Nombre de 1 2 3 4 5 TOTAL 
personnes 
Fréquence 0,162 0,260 0,383 0,130 0,065 1 


Groupement des valeurs Si une variable est continue, ou si ses valeurs sont 
trop nombreuses pour être énumérées au complet, il faut recourir à un 
groupement des valeurs. Le tableau 1.4 présente un exemple où la 
population est l'ensemble de tous les enseignants réguliers dans les cégeps 
du Québec en 1986-1987, et où la variable considérée est l'âge. 
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Classes d'étendues inégales Autant que possible, lorsqu'on groupe les valeurs 
d'une variable, on les groupe en classes d'étendues égales. Pour des 
raisons d'ordre pratique, on ne le fait pas toujours : parfois les données nous 
arrivent déjà groupées en classes d'étendues inégales, ou encore il peut 
être plus naturel d'utiliser des classes larges pour les grandes valeurs et des 
classes étroites pour les petites valeurs. 


Le tableau 1.5 présente une distribution où la population est l'ensemble des 
hommes canadiens de moins de 70 ans et où la variable est l'âge. Le 
groupement des données est celui de Statistique Canada. L'étendue des cinq 
premières classes est 5, celle des 4 suivantes est 10, et celle de la dernière 
est 5. 


Variables continues Dans le cas des variables continues, les classes sont 
contiguës et il faut prendre soin de bien identifier les limites des classes pour 
éviter toute équivoque quant à l'appartenance des points qui limitent les 
classes. L'une des conventions possibles est illustrée dans le tableau 1.6. La 
variable est dénotée par X et les classes sont définies par des inégalités qui 
montrent clairement à quelle classe chaque valeur appartient : il est clair, 
par exemple, que la valeur 2,0 appartient à la quatrième classe et non à la 
troisième. Remarquons que dans le tableau 1.6 la somme des fréquences est 
0,999 au lieu de 1,000. Il n'y a là rien d'alarmant, les arrondis décimaux en 
sont responsables. 


8 Introduction à la statistique appliquée 


TABLEAU 14 Distribution de l'âge des enseignants réguliers dans les cégeps au Québec - 1986-1987 


Âge Effectif Fréquence 
moins de 20 ans 1 0,000 
20-24 23 0,002 
25-29 300 0,032 
30-34 1113 0,118 
35-39 2 507 0,266 
40-44 2 620 0,278 
45-49 1 492 0,158 
50-54 693 0,074 
55-59 468 0,050 
60-64 171 0,018 
65+ 36 0,004 
TOTAL 9 424 1,000 


SOURCE : Bulletin Statistique (vol. 13, no 4), DGEC, ministère de l'Enseignement supérieur et de la Science du Québec (1988) 


TABLEAU 1.5 Âge des hommes canadiens de moins de 70 ans - 1986 


Âge Effectif (en milliers) Fréquence 

0-4 927,8 0,079 

5-9 920,1 0,078 
10-14 916,8 0,078 
15-19 983,3 0,084 
20-24 1 131,5 0,096 
25-34 2 248,8 0,191 
35-44 1 822,0 0,155 
45-54 1 276,2 0,108 
55-64 1 124,1 0,096 
65-69 414,5 0,035 
TOTAL 11 765,1 1,000 


SOURCE : Annuaire du Canada, 1988 


TABLEAU 1.6 
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Distribution du poids à la naissance des bébés québécois - 1983 


Poids (en kg) (X) Effectif Fréquence 
0,5 <X < 1,0 286 0,003 
10<X<1,5 436 0,005 
1,5<X< 2,0 1 070 0,012 
2,0<X<2,5 3 853 0,044 
2,5 <X< 3,0 15 945 0,183 
3,0<X< 3,5 34 163 0,392 
3,5 <X < 4,0 24 187 0,278 
40<X<4,5 6 301 0,072 
4,5<X< 5,0 784 0,009 
5,0<X<5,5 102 0,001 

TOTAL 87 127 0,999 


SOURCE : Bureau de la statistique du Québec, 1984 


1.3 


REPRÉSENTATIONS GRAPHIQUES 


Presque toute distribution peut avantageusement être présentée sous la 
forme d'un graphique. Un graphique nous permet de saisir en un coup d'oeil 
les caractéristiques d'une distribution et d'observer d'une manière immédiate 
et visuelle les différences qu'il peut y avoir entre deux populations. Les 
graphiques employés pour présenter des données abondent dans les revues 
populaires et sont d'une diversité illimitée. Il existe cependant quelques 
formes classiques, et nous en décrivons trois : le diagramme à bâtons, 
l'histogramme et le polygone des fréquences. 


Le diagramme à bâtons Le diagramme à bâtons s'applique bien aux variables 
qualitatives ou discrètes. La figure 1.2 est un diagramme à bâtons qui 
présente la distribution du tableau 1.3. La figure 1.3 présente la distribution 
d'une variable qualitative. Pour accommoder les textes à mettre en marge, il 
est cette fois plus naturel de placer les bâtons à l'horizontale plutôt qu'à la 
verticale. 


L'histogramme L'histogramme est un graphique formé de rectangles 
adjacents dont les bases sont constituées des classes de regroupement et 
dont les surfaces sont proportionnelles aux effectifs respectifs. 
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FIGURE 1.2 
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L'histogramme convient bien aux variables dont les valeurs sont 
nombreuses, en particulier aux variables continues. La figure 1.4 est 
l'histogramme qui représente la distribution du tableau 1.6. 


Distribution du nombre de personnes dans 770 ménages 
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SOURCE : Tableau 1.3 


Lorsqu'on construit un histogramme dont les classes sont d'étendues 
inégales, il faut se rappeler que c'est la surface d'un rectangle et non sa 
hauteur qui représente l'effectif. Par conséquent, lorsqu'une classe est deux 
fois plus étendue qu'une autre, la hauteur du rectangle correspondant doit 
être deux fois plus petite. La figure 1.5 illustre cette procédure. La sixième 
classe, par exemple, a une étendue deux fois plus grande que celle des cinq 
premières classes. Son effectif de 2 248,8 est donc représenté par un 
rectangle dont la hauteur, par rapport à l'échelle ayant servi à la 
construction des cinq premiers rectangles, est de 2 248,8 + 2 = 1 124,4. 
C'est comme si l'effectif de la classe 25-35 avait été réparti en deux, une 
partie pour chacune des classes 25-30 et 30-35. Pour comprendre la 
différence entre la première colonne du tableau 1.5 et les classes, lire 
l'énoncé de l'exercice 18. 
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FIGURE 1.3 Répartition des dépenses totales des administrations publiques du Canada - 1986 
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SOURCE : Un portrait du Canada, 1988 


FIGURE 1.4 Distribution du poids à la naissance des bébés québécois - 1983 
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SOURCE : Tableau 1.6 
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FIGURE 1.5 
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Il va de soi que lorsqu'un histogramme contient des classes d'étendues 
inégales, on ne peut indiquer les effectifs (ou les fréquences) au moyen d'une 
échelle commune placée à l'ordonnée. L'échelle verticale, dans ce cas, 
indique la densité des données, c'est-à-dire le nombre de données par unité 
de largeur de la classe pour chaque classe. 


Distribution de l'âge des hommes canadiens de moins de 70 ans - 1986 (en milliers) 
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SOURCE : Tableau 1.5 


Le polygone des fréquences Le polygone des fréquences est une alternative à 
l'histogramme, qui se prête particulièrement bien à des comparaisons de 
distributions. On construit un polygone des fréquences en joignant les 
milieux des sommets des rectangles d'un histogramme. On referme enfin les 
deux extrémités du graphique en faisant comme si deux rectangles de 
hauteur zéro précédaient et suivaient immédiatement ceux de l'histogramme. 


La figure 1.6 illustre comment les polygones des fréquences peuvent servir à 
faire des comparaisons entre deux populations. Les deux populations sont 
les filles et les garçons nés au Québec en 1983, et la variable dans les deux 
cas est le poids à la naissance. Les deux distributions sont données dans le 
tableau 1.7. Comme ces populations ne sont pas de même taille, leur 
distribution est exprimée en fréquences. Ce que ces fréquences nous disent, 
les polygones des fréquences nous le disent mieux (voir figure 1.6). On voit 
immédiatement que les deux distributions coïncident essentiellement pour 
les très petits bébés, alors qu'ailleurs la distribution des poids des filles est à 
gauche de celle des poids des garçons. En somme, on voit sur cette figure 
1.6 qu'il y a une fréquence plus élevée de «petits» bébés parmi les filles et de 
«gros» bébés parmi les garçons, alors que pour les très petits bébés, l'aspect 
le plus souvent accidentel de leur naissance fait qu'ils se divisent également 
entre les deux sexes. 


TABLEAU 1.7 


FIGURE 1.6 
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Afin de montrer la diversité des représentations graphiques d'une 
distribution, la figure 1.7 illustre une représentation dite « en pointes de 


tarte » souvent utilisée pour les variables qualitatives. 


Distribution du poids à la naissance des garçons et des filles du Québec - 1983 


Poids (en kg) (X) Centre de classe FeqUeRes - 

Garçons Filles 

0,5 < X < 1,0 0,75 0,003 0,003 
1,0<X<1,5 1,25 0,005 0,005 
1,5<X<2,0 1,75 0,010 0,012 
2,0<X<2,5 2,25 0,040 0,051 
2,5<X< 3,0 2,75 0,153 0,216 
3,0<X< 3,5 3,25 0,374 0,413 
3,5 <X<4,0 3,75 0,310 0,244 
40<X<4,5 4,25 0,093 0,050 
4,5 <X < 5,0 4,75 0,012 0,005 
5,0 < X:< 5,5 5,25 0,001 0,001 
TOTAL 1,001 1,000 


SOURCE : Bureau de la statistique du Québec, 1984 


Distribution du poids à la naissance des garçons et des filles du Québec - 1983 


Fréquence 


0,25 0,75 1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25 


Poids (en kg) à la naissance 


SOURCE : Tableau 1.7 
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FIGURE 1.7 
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Distribution de la population mondiale selon les continents 


Europe 
13,9% 
Afrique 
11,1% 
Amérique du 
Nord Asie 
8,2% 60,9% 
Amérique du 
Sud céanie 
5,4% 0,5% 


1.4 


ÉCHANTILLONS ET TEST D'AJUSTEMENT 


Introduction Dans les exemples que nous avons vus jusqu'ici, les dis- 
tributions étaient basées sur une énumération complète des membres de la 
population, c'est-à-dire sur un recensement. Parfois cette opération est 
relativement peu onéreuse, comme lorsque la population est l'ensemble des 
employés d'une compagnie ou l'ensemble des succursales d'une banque. La 
plupart du temps, par contre, le coût d'un recensement s'avère prohibitif. Le 
recensement du Canada constitue une opération si gigantesque qu'on ne le 
fait qu'à tous les cinq ou dix ans. 


En pratique, donc, les données dont on dispose pour faire une distribution 
sont, la plupart du temps, les données d'un échantillon, c'est-à-dire, d'une 
partie, souvent très petite, de la population. Il surgit alors une question 
fondamentale qui ne se pose pas lorsqu'on a les données de la population 
entière. C'est de savoir jusqu'à quel point il est permis d'extrapoler à la 
population entière les phénomènes observés dans l'échantillon. Quelle 
assurance a-t-on qu'une distribution observée dans l'échantillon est bien 
conforme à celle de la population entière ? Cette problématique est parfois 
exprimée, quelque peu naïvement, par la question : « Est-ce que l'échantillon 
est représentatif ? ». 
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Comme on le verra, cette question n'admet pas de réponse du type « oui » ou 
« non ». En fait, elle n'admet pas de réponse du tout car elle est mal posée. 
Elle sous-entend l'existence d'un critère qui permettrait de déclarer, une fois 
pour toutes, que l'échantillon est bon, et d'affirmer que tout ce qui est vrai 
de l'échantillon est vrai de la population. 


Malheureusement, il n'en est pas ainsi. C'est chaque conclusion qui doit être 
validée, et non l'échantillon comme tel. La question que nous poserons sera, 
non pas si l'échantillon est bon ou mauvais, mais plutôt : « Est-ce que telle ou 
telle conclusion peut, avec peu de risque d'erreur, s'appliquer à la population 
entière ? » La façon d'y répondre dépend du contexte et du type de 
conclusion qu'on veut tirer à propos de la population, mais repose 
essentiellement sur l'étude de la similitude entre la distribution de la 
population et celle de l'échantillon. Nous développons, dans l'exemple qui 
suit, un test destiné à évaluer cette similitude, à juger mathématiquement 
de l'ajustement entre la distribution d'un échantillon et une distribution 
théorique ou idéale. 


On entend souvent dire que les naissances sont influencées par la lune. On 
dit, entre autres, qu'il y a beaucoup de naissances à la pleine lune. Pour 
savoir ce qu'il y a de vrai dans ces affirmations, on prélève un échantillon de 
860 naissances, choisies au hasard. On obtient les résultats suivants : 


Phase Nouvelle lune Premier quartier Pleine lune Dernier quartier TOTAL 
Effectif 76 88 100 96 360 
Fréquence 0,211 0,244 0,278 0,267 1,000 


Il y a en effet plus de naissances à la pleine lune que durant les autres 
phases ; si ce constat semble appuyer la croyance populaire, il ne permet 
toutefois pas encore d'en tirer des conclusions : ces chiffres sont sujets au 
hasard et ce qui semble significatif pourrait n'être qu'un accident. Le 
problème est de décider s'il s'agit bien d'un accident ou si, au contraire, 
l'échantillon reflète un phénomène réel. Cette décision s'avère facile dans les 
cas extrêmes. Nous n'aurions pas de difficulté à attribuer au hasard les 
différences entre les effectifs ci-dessous : 


Phase Nouvelle lune Premier quartier Pleine lune Dernier quartier TOTAL 


Effectif 89 88 92 91 360 
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Nous dirions volontiers que s'il y a eu plus de naissances à la pleine lune, 
c'est par pur hasard. Par contre, le hasard nous semblerait insuffisant pour 
expliquer les différences dans un tableau comme le suivant : 


Phase Nouvelle lune Premier quartier Pleine lune Dernier quartier TOTAL 


Effectif 10 20 300 30 360 


Dans ce cas, on n'aurait pas d'hésitation à affirmer que les naissances sont 
plus fréquentes, plus probables, à la pleine lune. Qu'un tel déséquilibre 
puisse s'être produit par pur hasard est trop invraisemblable. 


Ces arguments élémentaires sont parfaitement convaincants lorsque les 
tableaux se présentent sous des formes aussi extrêmes. Mais le tableau que 
nous avons présenté au début de cet exemple est plus problématique, et 
pour en tirer des conclusions nous aurons besoin de techniques plus 
raffinées. Dans ce qui suit, nous commencerons par donner un énoncé 
formel du problème — étape indispensable — et nous présenterons une 
procédure de solution. Ensuite nous discuterons la logique qui justifie la 
procédure. Rappelons toutefois que cette logique est essentiellement la 
logique intuitive que nous venons d'exposer. Il reste à quantifier ces 
raisonnements pour qu'ils permettent de conclure, dans des cas moins 
évidents. 


Énoncé formel du problème et procédure de résolution Les données présentées 
dans l'exemple ont été prélevées pour répondre à une question dont l'énoncé, 
un peu vague, est « les naissances dépendent-elles des phases de la lune ? » 
La question est un peu vague parce qu'une dépendance entre les naissances 
et la lune peut prendre plusieurs formes : la lune peut avoir un effet 
important ou négligeable ; et la pleine lune peut favoriser ou défavoriser les 
naissances. Mais les naissances n'ont qu'une seule façon d'être 
indépendantes de la lune. Donc, des différentes hypothèses en concurrence, 
nous allons en privilégier une, que nous appellerons hypothèse nulle et qui 
s'énonce dans ce contexte par : 


Hypothèse nulle : les naissances ne sont pas influencées par les phases de la 
lune. 


Nous choisissons celle-ci et pas une autre parce qu'elle est univoque et peut 
s'exprimer de façon quantitative. Affirmer que la lune n'a aucun effet sur les 
naissances revient à dire qu'aucune phase n'est plus ou moins propice aux 
naissances qu'une autre. Puisque chaque phase lunaire est pratiquement de 
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même durée, une naissance se produit dans l'une ou l'autre des quatre 
phases avec la même probabilité, soit 1/4. Et c'est précisément comme cela 
que nous pouvons maintenant exprimer l'hypothèse nulle : 


Hypothèse nulle : les naissances se distribuent selon les phases de la lune 
selon les probabilités 1/4, 1/4, 1/4 et 1/4. 


Il s'ensuit que les 360 naissances devraient théoriquement se répartir 
comme suit : 


Phase Nouvelle lune Premier quartier Pleine lune Dernier quartier TOTAL 


Effectif 90 90 90 90 360 


Ces effectifs sont appelés effectifs théoriques. 


Le tableau suivant présente les deux séries de données, qui résument 
numériquement le cheminement jusqu'ici. 


TOTAL 
Effectifs observés 76 88 100 96 360 
Effectifs théoriques 90 90 90 90 360 


Remarque Le total des effectifs théoriques est toujours égal à celui des 
effectifs observés : c'est la taille de l'échantillon. 


Entre les deux séries d'effectifs, nous observons des écarts, dont nous allons 
calculer une mesure globale. La mesure que nous allons employer, notée y? 
(« khi-deux ») est définie par la formule suivante : 


(o-T) 
T 


X?=Y 


où O représente les effectifs observés, T représente les effectifs théoriques, et 
la lettre grecque Y (sigma majuscule) désigne « la somme de ». 


Pour les données de notre exemple, la valeur de y? est 
(76-90) (88-90) (100-90) (96-90) 
+ + + 
90 90 90 90 
196+4+100 +36 
90 


X°? 


= 3,73 
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TABLEAU 1.8 


Il reste à tirer une conclusion à partir de la valeur de y? trouvée, c'est-à-dire 
à déduire le rejet ou non de l'hypothèse nulle selon l'importance des écarts 
entre les deux séries d'effectifs, mesurée par ce 2. Nous rejetons l'hypothèse 
nulle si ces écarts sont trop grands. La valeur de y? sera considérée « trop 
grande » si elle est supérieure à un certain nombre, appelé point critique. 
Ce point critique n'est pas le même pour tous les problèmes : il dépend du 
nombre de classes dans la distribution ou, plus précisément, d'un paramètre 
v (« nu »), appelé nombre de degrés de liberté, qui est égal au nombre de 
classes, moins 1 : 


v = (nombre de classes) - 1 


Note Cette définition, purement mathématique, correspond intuitivement au 
fait que, pour les données étudiées plus haut, par exemple, on pourrait 
attribuer « librement » un effectif à 3 des 4 classes ; la valeur de la quatrième 
serait alors imposée par le respect du total de 360. 


Le tableau 1.8 donne, pour plusieurs valeurs de v, le point critique 
correspondant. Dans cet exemple, le nombre de classes est 4, donc v = 4-1=3 
et la table nous donne comme point critique le nombre 7,82. Puisque la valeur 
de 7? obtenue, 3,73, est inférieure à ce point critique, nous ne rejetons pas 
l'hypothèse nulle. En d'autres termes, l'écart de 3,73 entre la distribution 
observée et la distribution uniforme est assez petit pour être expliqué par le seul 
hasard. 


Points critiques pour x2 


Degrés de Point Degrés de Point Degrés de Point 
liberté v critique liberté v critique liberté v critique 
1 3,84 11 19,68 21 32,67 
2 5,99 12 21,03 22 33,92 
3 7,82 13 22,36 23 35,17 
4 9,49 14 23,68 24 36,42 
5 11,07 15 25,00 25 37,65 
6 12,59 16 26,30 26 38,89 
7 14,07 17 27,59 27 40,11 
8 15,51 18 28,87 28 41,34 
9 16,93 19 30,14 29 42,56 
10 18,31 20 31,41 30 43,77 


Avec ces points critiques, la probabilité de rejeter l'hypothèse nulle, si elle est vraie, est de 5 % 
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Justification de la procédure La procédure que nous venons d'employer, 
appelée test d'hypothèse, commence par l'énoncé d'une hypothèse stipulant 
que les « vraies » fréquences, celles de la population d'où est issu 
l'échantillon, sont une série de fréquences données. Ces fréquences sont 
exprimées en « effectifs théoriques ». Les effectifs théoriques sont les effectifs 
auxquels on s'attend lorsque l'hypothèse nulle est vraie. Les effectifs 
observés ne coïncident pas exactement avec les effectifs théoriques, même si 
l'hypothèse nulle est vraie : le hasard fait qu'en général l'échantillon n'est 
pas une parfaite réplique de la population. Aïnsi, lorsque les effectifs 
observés s'écartent un peu des effectifs théoriques, nous n'allons pas 
conclure que l'hypothèse nulle est fausse : nous allons attribuer les écarts 
au hasard. Mais lorsque ces écarts sont très importants, il devient difficile de 
croire que le hasard seul puisse en être responsable. 


La théorie des probabilités permet de calculer la probabilité d'avoir des 
écarts de tel ou tel ordre de grandeur. Elle permet de remarquer que certains 
écarts très grands ne se produisent que très rarement, c'est-à-dire qu'ils sont 
très peu probables. En présence de tels écarts, nous sommes portés à rejeter 
l'hypothèse nulle. 


Nous mesurons l'ensemble des écarts entre les effectifs théoriques et les 
effectifs observés par une mesure globale, le y2. La théorie des probabilités 
permet de dire entre quelle et quelle valeurs, la valeur de y? devrait 
« normalement » (avec une probabilité élevée) se tenir, et de déterminer des 
« points critiques » comme ceux du tableau 1. 8. 


Dans le problème que nous venons de traiter, le point critique est 7,82. Dans 
un tel cas, deux situations peuvent alors se présenter, et deux issues sont 
possibles pour ce test : 


a) toute valeur de y? inférieure à 7,82 est considérée petite, dans le sens où 
la probabilité d'avoir un tel y? (inférieur à 7,82) est grande ; dans ce cas, 
on ne peut pas rejeter l'hypothèse nulle. C'est le cas du problème 
ci-dessus ; 


b) toute valeur de y? supérieure à 7,82 est considérée grande, dans le sens 
où la probabilité d'avoir un tel y? est petite ; dans ce cas, on doit rejeter 
l'hypothèse nulle ; ce sera le cas dans l'exemple ci-après (exemple 4). 


Dans le tableau des points critiques, la définition d'une probabilité petite a 
été fixée à 5 %. 
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Exemple 4 


TABLEAU 1.9 


Dans l'exemple précédent, la distribution était celle d'une population « idéale », 
situation qui se rencontre souvent dans l'étude des résultats d'un jeu de 
hasard ou d'une expérience scientifique indéfiniment répétable. L'hypothèse 
nulle, dans ce cas, portait sur les probabilités respectives de chaque classe. 
Dans l'exemple que nous allons maintenant étudier, la population est réelle et 
ce sont les fréquences relatives des diverses classes qui vont nous intéresser. 


Supposons qu'on s'intéresse à la distribution des revenus des familles 
immigrantes au Canada, afin de la comparer à celle de l'ensemble des 
familles canadiennes. Cette dernière nous est connue ; le tableau 1.9 la 
donne pour 1985. 


Pour la population des immigrants, les données ne sont pas connues. On 
prélève donc, au hasard, un échantillon de 500 familles, et on détermine la 
distribution comme s'il s'agissait d'une population. On obtient les données du 
tableau 1.10, fictives mais vraisemblables. Nous les exprimons aussi en 
fréquences pour les rendre comparables plus facilement à celles du tableau 1.9. 


L'examen de ces deux tableaux nous amène à constater que les familles 
immigrantes sont moins riches : elles ont une plus grande fréquence de 
revenus faibles et une plus petite de revenus élevés. Mais cette affirmation, 
vraie des 500 familles de l'échantillon, n'est peut-être pas vraie de l'ensemble 
de toutes les familles immigrantes au Canada. Il n'est pas impossible que 
l'ensemble des familles immigrantes ait un revenu distribué de la même 
façon que celui de l'ensemble des familles canadiennes. Les différences 
observées dans l'échantillon seraient alors le fruit du hasard. Pour répondre 
à la question, nous allons utiliser le même test d'ajustement, basé sur le 
calcul du ÿ?, que dans le premier exemple. Nous commençons, comme 
toujours, par énoncer l'hypothèse nulle que nous allons étudier. 


Distribution des revenus (en milliers de dollars) des familles canadiennes - 1985 


Revenu 0-15 15-25 25-40 40-60 60+ TOTAL 


Fréquence 0,137 0,175 0,271 0,256 0,161 1,000 


SOURCE : Statistique Canada 


TABLEAU 1.10 Distribution des revenus (en milliers de dollars) des familles immigrantes - 1985 


Revenu 0-15 15-25 25-40 40-60 60+ TOTAL 


Effectif 80 92 163 110 55 500 


Fréquence 0,160 0,184 0,326 0,220 0,110 1,000 
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Hypothèse nulle : Les revenus des familles immigrantes ont la même 
distribution de fréquences que ceux des familles canadiennes, soit 


0,137 0,175 0,271 0,256 0,161 


Effectifs théoriques : L'hypothèse nulle affirme toujours l'égalité de deux 
distributions, exprimées en probabilités ou en fréquences ; toutefois le calcul 
de y? se fait toujours sur des effectifs. Une fois l'hypothèse nulle énoncée, 
nous devons calculer les effectifs théoriques, qui correspondent à la 
répartition de l'échantillon proportionnellement aux fréquences énoncées par 
l'hypothèse nulle. Dans notre exemple, on obtient 


0,137 x 500 0,175x500 0,271 x 500 0,256 x 500 0,161 x 500 
ou encore 
68,5 87,5 135,5 128 80,5 


Le tableau suivant présente les données nécessaires au calcul de y? 


TOTAL 
Effectifs observés 80 92 163 110 55 500 
Effectifs théoriques 68,5 87,5 135,5 128 80,5 500 


Calcul de y? 


(80-68,5)* (92-87,5)° (55-80,5)° 
= + + + ————— 
68,5 87,5 80,5 


2 


=1,93+0,23+5,58 +2,53 +8,08 
= 18,35 
Nombre de degrés de liberté : Il y a 5 classes dans la distribution ; le nombre 
de degrés de liberté est donc 
v=5-1=4 
Le point critique correspondant est 9,40. 


Conclusion : La valeur de y? obtenue, 18,35, est supérieure au point critique 
(18,35 > 9,49). Nous devons donc rejeter l'hypothèse nulle et conclure que le 
revenu des familles immigrantes n'est pas distribué de la même manière que 
celui des familles canadiennes. (Le hasard seul ne peut expliquer l'écart 
observé entre les deux distributions.) + 
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Mise en garde Le test d'hypothèse décrit dans cette section est basé sur des 
calculs approximatifs qui ne sont valables que lorsque les effectifs sont 
grands. En pratique, on évite d'employer ce test si certains effectifs théoriques 
sont inférieurs à 5 (ou encore on regroupe des classes afin que tous les 
effectifs théoriques soient au moins égaux à 5). 


RÉSUMÉ 


1. Les éléments d'une population sont appelés unités statistiques. Une 
variable fait correspondre une valeur à chaque élément de la population. 
Une variable est dite qualitative ou quantitative selon que ses valeurs 
représentent des qualités ou des quantités. Une variable quantitative est 
dite discrète si elle ne peut prendre que des valeurs isolées ; elle est dite 
continue si elle peut, théoriquement, prendre pour valeur tout nombre 
réel compris dans un intervalle. 


2. Une distribution fait correspondre à chaque valeur x d'une variable X un 
effectif ou une fréquence, c'est-à-dire le nombre ou la proportion des 
unités statistiques pour lesquelles X prend la valeur x. La somme des 
effectifs est appelée l'effectif total. La somme des fréquences est 
toujours égale à 1. Lorsque les valeurs d'une variable sont très 
nombreuses, on les groupe en classes, et c'est à ces classes que la 
distribution fait correspondre des effectifs ou des fréquences. 


3. Le diagramme à bâtons est une représentation graphique qui s'applique 
aux variables qualitatives et aux variables quantitatives discrètes dont 
les valeurs sont relativement peu nombreuses (figure 1.2). Pour les 
variables dont les valeurs sont groupées — les variables continues et les 
variables discrètes à valeurs nombreuses -— l'histogramme est une 
représentation graphique appropriée (figure 1.4). Dans un histogramme, 
c'est la surface du rectangle — et non sa hauteur — qui est proportionnelle 
à la fréquence (figure 1.5). Le polygone des fréquences se construit en 
joignant les milieux des côtés supérieurs des rectangles d'un 
histogramme (figure 1.6). 


4. Pour tester une hypothèse concernant la population d'où est issu 
l'échantillon, on suit les étapes ci-dessous : 


a) On formule une hypothèse nulle, selon laquelle les fréquences de la 
distribution de la population sont égales à certaines fréquences 
données. 


b) 
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On détermine les effectifs théoriques. Ce sont les effectifs qu'on 
s'attend à observer dans l'échantillon lorsque l'hypothèse nulle est 
vraie. 


On mesure la « distance » entre les effectifs théoriques (T) et les 
effectifs observés (O) par la quantité y? : 


2 (O=-TY 
D. 


On rejette l'hypothèse nulle si la valeur de y? se révèle trop grande, 
c'est-à-dire si elle est supérieure au point critique trouvé dans le 
tableau 1.8, où v, le nombre de degrés de liberté, est égal au 
nombre de classes dans le tableau, moins 1. 


Si l'on utilise la procédure décrite, la probabilité de rejeter l'hypothèse nulle 
lorsqu'elle est vraie est à peu près de 5 %. L'approximation est d'autant 
meilleure que les effectifs théoriques sont grands. Il est préférable d'éviter 
d'employer le test lorsque certains effectifs théoriques sont inférieurs à 5. 


EXERCICES 


POPULATION ET 
VARIABLES 


1. Dites lesquelles des variables suivantes sont respectivement quantitatives 
ou qualitatives : 


a) 
) 
©) 
d) 
) 


(Cx 


o 


La superficie des lacs du Canada. 

Le pays d'origine des immigrants. 

La cause du décès, pour l'ensemble des décès dans un hôpital. 
Les effectifs étudiants dans les universités canadiennes. 


Le nombre de tonnes kilométriques transportées par les différentes 
compagnies de camions. 


L'intensité, en ampères, d'un courant électrique. 
L'état matrimonial des employés d'une compagnie. 

Le quotient intellectuel des étudiants d'une université. 
L'ancienneté des employés d'une compagnie. 


L'allégeance politique des électeurs. 
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DISTRIBUTIONS ET 
REPRÉSENTATIONS 


GRAPHIQUES 


2. 


Pour chacune de ces variables, donnez quelques-unes des valeurs 
possibles. Dans le cas des variables quantitatives, dites si elles sont 
discrètes ou continues. 


Parfois il nous est possible, en faisant appel à ce que nous savons d'une 
situation familière, de décrire, a priori, la distribution approximative 
d'une variable. Dans chacun des cas suivants, on définit une population 
et une variable. Tentez de deviner l'allure de la distribution. 


Population : l'ensemble des salariés de sexe masculin, vivant dans 
des régions urbaines du Canada. Variable : le salaire annuel. 


Population : l'ensemble des naissances au Canada. Variable : l'âge de 
la mère. 

Population : un ensemble de 1000 Américains et de 1000 Pygmées. 
Variable : la taille. 

Population : un ensemble de 1000 Américains et de 1000 Français. 
Variable : la taille (Note : les Français sont légèrement plus petits que 
les Américains). 

Population : un ensemble de paquets de 12 oranges, formés à partir 
d'un grand lot d'oranges dont 5 % sont gâtées. Variable : le nombre 
d'oranges gâtées. 

Mêmes données qu'en (e), sauf que le pourcentage d'oranges gâtées 
dans le lot est 50 %. 

Population : 36 000 lancers d'un dé. Variable : le résultat du lancer. 
Population : les soldats canadiens de sexe masculin. Variable : la 
taille. 

Population : les élèves d'une classe. Variable : leur note à un examen 
difficile. 

Population : des boulons produits par une même machine. Variable : 
leur diamètre, en millimètres. 


3. Voici le revenu net, 
compagnies multinationales : 
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exprimé en pourcentage des ventes, de 150 


4,9 
6,9 
4,8 
11,6 
6,9 
5,3 
7,8 
3,5 
0,8 
8,2 
3,2 
4,1 
8,1 
8,4 
3,4 


2,4 
5,2 
44 
7,7 
0,1 
5,7 
7,6 
3,9 
7,4 
4,9 
4,7 
4,2 
4,1 
2,0 
3,7 


9,8 
2,6 
4,5 
4,6 
3,5 
2,3 
7,7 
7,9 
9,9 
4,3 
7,9 
4,7 
8,0 
6,7 
3,8 


3,8 
2,9 
3,6 
5,6 
1,0 
4,6 
10,8 
2,0 
3,4 
3,3 
5,5 
0,7 
2,8 
3,8 
4,3 


7,7 
4,8 
8,2 
3,7 
3,1 
1,4 
4,8 
5,5 
44 
3,0 
8,8 
3,5 
9,4 
1,8 
6,5 


6,0 
9,0 
2,4 
5,2 
8,2 
1,8 
2,4 
4,8 
3,2 
5,0 
5,7 
2,8 
5,2 
8,3 
1,6 


3,3 
4,3 
3,3 
6,4 
2,9 
5,9 
2,0 
5,9 

11,1 
0,3 
2,3 
44 
5,4 
2,8 
8,3 


3,6 
1,6 
10,3 
2,4 
6,7 
6,5 
3,2 
1,3 
3,6 
7,7 
3,5 
5,9 
5,4 
2,8 
10,4 


4,7 
2,6 
44 
0,6 
4,5 
5,1 
4,1 
3,9 
5,6 
4,9 
1,5 
6,0 
0,6 

10,3 
5,6 


0,8 
4,1 
5,3 
4,6 
44 
6,8 
4,5 
7,9 
2,0 
6,2 

10,9 
6,8 
3,9 
0,6 
4,6 


a) Présentez ces données sous la forme d'une distribution. Pour chaque 


classe, donnez l'effectif et la fréquence. 


b) Représentez la distribution par un histogramme et par un polygone 
des fréquences. Construisez deux échelles verticales : l'une, à gauche, 


marquant l'effectif ; l'autre, à droite, marquant les fréquences. 


4. Voici les gains hebdomadaires moyens (en dollars) dans 70 centres 
urbains en 1988 : 


390 
561 
467 
531 
491 
718 
438 


385 
427 
402 
571 
552 
513 
467 


418 
433 
388 
393 
439 
491 
550 


368 
451 
379 
412 
475 
567 
318 


341 
411 
506 
437 
462 
431 
439 


427 
407 
602 
617 
501 
438 
398 


471 
387 
376 
512 
392 
368 
519 


401 
451 
465 
407 
419 
337 
539 


519 
419 
459 
519 
571 
415 
315 


467 
387 
502 
392 
437 
352 
AT5 


Présentez ces données sous la forme d'une distribution. Faites-en un 


histogramme et un polygone des fréquences. 
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5. 


TEST DU KHI-DEUX 6. 


Tracez le diagramme à bâtons de la distribution suivante de 300 
accouchements selon les jours de la semaine : 


Jour Lu Ma Me Je Ve Sa Di TOTAL 


Effectif 50 42 47 42 44 40 35 300 


Supposons qu'un administrateur d'hôpital vous demande de vérifier si les 
accouchements, dont la distribution est donnée dans le problème 
précédent, se répartissent uniformément : 


a) Formulez une hypothèse nulle, d'abord dans le langage courant, puis 
en termes d'une distribution. 


b) Déterminez les effectifs théoriques. Expliquez en vos propres mots ce 
que ces effectifs signifient. 


c) Calculez #2. 


d) Dites si la valeur de x? est trop grande ou pas assez, et dites en quel 
sens elle est « trop grande » ou « pas assez ». 


Pour savoir si un dé est bien équilibré, on le lance 36 fois, et on obtient 
les résultats suivants : 


Résultat 1 2 3 4 5 6 TOTAL 


Fréquence 219 7136 1/4 1112 5/36 1/9 1 


Tracez le diagramme à bâtons de la distribution et répondez aux mêmes 
questions qu'au numéro 6. 


Il y a eu en une année 33 540 naissances dans une province du Canada. 
17 206 de ces naissances étaient des garçons et 16 334 des filles. Est-ce 
un simple hasard que le nombre de garçons et de filles ne soit pas le 
même ? Formulez clairement votre hypothèse et explicitez votre 
démarche. 


Au numéro 8, l'écart entre la distribution observée et la distribution 
théorique a été très significatif dans le sens où la valeur calculée de 72 
était de beaucoup supérieure au point critique. Pourtant, la proportion 
observée de garçons, 17 206 / 33 540 = 51,3 %, n'est pas très éloignée 
de 1/2. Quel sens donnez-vous alors à « très significatif » ? 


DIVERS 
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10. Pour comparer l'aptitude en mathématiques des Orientaux à celle des 


11. 


Américains de race blanche, Tsang (1984) a examiné les résultats d'un 
échantillon de 10 097 étudiants orientaux au test de mathématiques du 
SAT (Scholastic Aptitude Test). La distribution des scores est donnée dans 
le tableau suivant, qui présente également la distribution, en fréquences, 
des scores de tous les Américains de race blanche. 


Si Orientaux Américains blancs 
(effectifs) (fréquence) 
700-800 601 0,045 
600-690 2 001 0,172 
500-590 3 190 0,314 
400-490 2 788 0,301 
300-390 1 309 0,148 
200-290 208 0,020 


Y a-t-il une différence significative entre les Orientaux et les Américains 
de race blanche ? 


Pour savoir si un dé est bien équilibré, on le lance 360 fois, et on obtient 
la même distribution qu'au numéro 7. Répétez l'exercice. Pouvez-vous 
expliquer les conclusions contradictoires ? 
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12. Le tableau suivant donne la distribution des revenus pour les gens ayant 
un niveau d'instruction élémentaire (hommes et femmes) au Canada en 
1984. 


Distribution des revenus selon le sexe pour les gens ayant complété les seules études 
élémentaires - Canada, 1984 


Fréquence 
Revenu 
Hommes Femmes 

O- 1000 0,028 0,055 
1000- 5 000 0,085 0,235 
5 000 - 10 000 0,315 0,472 
10 000 - 15 000 0,121 0,136 
15 000 - 20 000 0,119 0,059 
20 000 - 25 000 0,111 0,025 
25 000 - 30 000 0,092 0,008 
30 000 - 35 000 0,082 0,006 
35 000 - 50 000 0,047 0,004 


SOURCE : Adapté de l'Annuaire du Canada, 1986-87 


a) Faites un histogramme pour la distribution des hommes et un autre 
pour celle des femmes. 


b) Comparez ces deux distributions en utilisant leur polygone des 
fréquences. 


15. 


14. 
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Faites un histogramme pour représenter la distribution de l'âge des 
catholiques d'âge scolaire et préscolaire en 1979. 
Âge Effectif Âge Effectif Âge Effectif 
0 46 159 7 59 733 14 83 817 
1 60 271 8 63 002 15 85 831 
2 62 812 9 64 828 16 88 157 
3 62 754 10 63 817 17 80 105 
4 64 010 11 65 504 18 84 682 
5 60 204 12 69 365 19 81 404 
6 60 001 13 74 630 20 75 453 


SOURCE : Le recensement scolaire. Document statistique 53, Direction des études économiques et démographiques, Secteur de la 


planification, ministère de l'Éducation du Québec 


En 1976, 184 939 femmes âgées de 15 à 65 ans se sont mariées au 
Canada. Cette population de nouvelles mariées est divisée en trois 
sous-populations : les célibataires, les veuves et les divorcées. Voici la 
distribution de l'âge pour chacune des sous-populations. 


Répartition des mariages au Canada selon l'âge et l'état civil de l'épouse - 1976 


État civil 
Âge Célibataires Veuves Divorcées Toutes 
15-19 44 827 20 86 44 933 
20-24 81 345 175 2 558 84 078 
25-29 21 774 391 6 162 28 327 
30-34 5 216 394 4785 10 395 
35-39 1 768 425 2 958 5151 
40-44 833 529 2121 3 483 
45-49 521 795 1 589 2 905 
50-54 383 932 1 125 2 440 
55-59 265 1 041 563 1 869 
60-64 176 947 235 1 358 
Total 157 108 5 649 22 182 184 939 


SOURCE : Annuaire du Canada, 1980-1981 
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15. 


16. 


Comparez les trois distributions en construisant trois polygones des 
fréquences superposés. 


Une équipe de chercheurs dispose de données sur la population 
suivante : l'ensemble de tous les accidents qui ont eu lieu au Québec en 
1980 et qui ont entraîné des blessures corporelles. Pour la plupart des 
variables, il était aisé d'obtenir les données pour la population entière. 
Pour certaines autres variables, comme celles identifiant la position 
exacte du véhicule lors de l'accident, il était difficile d'en déterminer les 
valeurs et on ne pouvait se permettre de le faire pour une population 
entière. Il a donc fallu prélever un échantillon pour étudier la distribution 
de ces variables-là. On a prélevé un échantillon de 600 accidents. 
Malheureusement, l'échantillon n'a pas été prélevé de façon purement 
aléatoire, ce qui faisait douter de sa représentativité ; on a choisi une 
variable particulière, la variable « gravité de la blessure», dont on 
connaissait la distribution pour la population entière ainsi que pour 
l'échantillon. Les deux distributions sont les suivantes : 


Blessure Mortelle Très grave Grave Pas grave TOTAL 
Fréquence 
. 0,20 0,30 0,30 0,20 1 
(population) 
Fréquence 
0,10 0,30 0,40 0,20 1 
(échantillon) 


a) Formulez convenablement l'hypothèse que l'échantillon est 
représentatif. 


b) Testez cette hypothèse et exprimez clairement votre conclusion. 


La population des ménages canadiens a été divisée en deux 
sous-populations : les ménages dont le chef de famille est un homme ; 
les ménages dont le chef de famille est une femme. Voici 
approximativement la distribution de l'âge du chef de famille pour les 
deux sous-populations. (Les données, tirées de l'Annuaire du Canada 
1980-1981, ont été légèrement modifiées pour les besoins de cet 
exercice.) 


17. 


1 Distributions 


Répartition des ménages canadiens selon l'âge et le sexe du chef de la famille - 1976 (en milliers) 


Sexe du chef de famille 


Age Tous 
Masculin Féminin 

15 - 24 431 154 585 
25 - 34 1457 222 1 679 
35 - 44 1185 154 1 339 
45-54 1115 190 1 305 
55 - 64 841 238 1 079 
65 - 74 567 286 853 
75 - 84 153 172 325 

Tous 5 749 1416 7 165 


Construisez deux polygones des fréquences qui permettent de comparer 


les deux populations. Interprétez les différences. 


Une firme de comptables agréés est chargée de surveiller un imprimeur 
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de billets de loterie. Les billets sont numérotés de 10 000 à 99 999, L'un 


de ces billets, choisi au hasard par l'imprimeur, doit être le billet gagnant 
du gros lot. Les comptables observent les billets gagnants de 72 loteries 
consécutives. Leur objectif est de savoir si les numéros gagnants sont 


réellement choisis au hasard. Voici les données : 


10 252 
45 222 
67 315 
34 156 
45 220 
68 221 
42 178 
64 568 
20 351 


17 642 
64 112 
38 277 
52111 
72115 
32 175 
64 392 
69 212 
24 876 


58 391 
33 914 
77 319 
18 394 
67 313 
46 317 
28 491 
56 319 
87 719 


57 278 
39 126 
44 839 
27 831 
34 218 
57 322 
18 349 
57 100 
83 212 


76 217 
77 319 
32 187 
78 989 
15 268 
25 681 
56 122 
86 341 
82 119 


13 841 
23 440 
85 432 
49 721 
76 677 
47 362 
21 167 
12 224 
83 314 


91 276 
91 328 
99 877 
96 543 
95 212 
94 323 
95 121 
96 131 
12 133 


21 367 
21 478 
34 512 
45 678 
53 217 
67 212 
77777 
21 121 
31 211 


Quelle est votre conclusion ? 
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18. Les deux tableaux suivant présentent la même distribution, mais avec 
des classes formées de façons différentes. Il s'agit de la distribution de 
l'âge de la population canadienne de moins de 90 ans. Construisez, sur 
la même échelle, un histogramme correspondant à chacun des tableaux. 
(Un histogramme n'admet pas d'espaces vides entre les classes. Donc, 
dans le graphique, les limites des classes ne devraient pas être 
identiques à celles du tableau. Puisque « l'âge » signifie « l'âge au dernier 
anniversaire », les intervalles devraient être [0, 5], [5, 10], etc.) 


Deux distributions de l'âge, population canadienne de moins de 90 ans 


Agë ÉHOEAr (en Âoe FUSCUE (en 
milliers) milliers) 

0-4 1 816 0-4 1 816 
5-9 2 254 5-9 2 254 
10-14 2311 10-14 2311 
15-19 2114 15-19 2114 

20-24 1 889 20-24 1 889 

25-29 1 584 25-29 1 584 

30-34 1 305 30-34 1 305 

35-39 1 264 35-44 2 527 

40-44 1 263 45-54 2 292 

45-49 1 239 55-64 1 732 
50-54 1 053 65-89 1 707 
55-59 955 

60-64 777 

65-69 620 

70-74 457 

75-79 326 

80-84 204 

85-89 100 


TOTAL 21 531 TOTAL 21 531 


19. 


20. 


21. 
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Dans le cadre d'une étude sur les habitudes de lecture des élèves du 
secondaire, des chercheurs ont fait compléter un questionnaire à 1 687 
élèves”. Avant d'analyser les réponses aux questions principales - celles 
traitant des habitudes de lecture - les chercheurs ont procédé à quelques 
comparaisons entre les données de leur échantillon et celles du 
recensement du Canada, afin de se rassurer sur la « représentativité » de 
leur échantillon. L'une des variables examinées est le sexe. Selon le 
recensement, la proportion de garçons dans la population est de 51,95 %. 
Dans l'échantillon, le nombre de garçons est de 847, soit 50,21 %. 
L'échantillon semble-t-il représentatif ? (Qualifier un échantillon de 
« représentatif » est un abus de langage, car le terme suggère que 
l'échantillon est en tous points une réplique exacte de la population, chose 
impossible. Voir le numéro 15 pour une interprétation correcte du terme.) 


Les chercheurs (numéro 19) ont aussi étudié la répartition de leur 
échantillon selon le niveau scolaire et le sexe. Voici les distributions 
conjointes qu'ils ont obtenues : 


Population Échantillon 

Niveau Sexe Sexe 

ScAE : | TOTAL : = TOTAL 
Sec.i 0,104 0,088 0,192 0,107 0,099 0,206 
Sec. 2 0,089 0,113 0,202 0,105 0,101 0,206 
Sec. 3 0,106 0,095 0,201 0,110 0,105 0,215 
Sec. 4 0,110 0,092 0,202 0,100 0,099 0,199 
Sec. 5 0,092 0,111 0,203 0,086 0,088 0,174 
TOTAL 0,501 0,499 1,000 0,508 0,492 1,000 


Répondez à la même question qu'au numéro 19. 


Les chercheurs mentionnés au numéro précédent ont examiné aussi la 
répartition de l'échantillon et de la population selon l'âge. Voici les deux 
distributions en pourcentages : 


Âge 12 13 14 15 16 17 18+ TOTAL 
Population 13,53 19,47 20,79 20,58 16,83 5,81 2,55 99,56 
Échantillon 9,2 19,9 20,1 19,5 20,2 8,2 2,3 99,4 


Répondez à la même question qu'au numéro 19. 


Û Rapport d'enquête sur les habitudes de lecture des élèves du secondaire, Direction générale du 
développement pédagogique, ministère de l'Éducation du Québec 
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22. 


23. 


Après avoir prélevé un échantillon de familles dans la zone 
métropolitaine de Montréal", des chercheurs se proposent d'évaluer leur 
procédure de sélection de l'échantillon. Pour ce faire, ils examinent la 
distribution de la variable « scolarité du chef de ménage » dans 
l'échantillon et dans la population. Voici les deux distributions : 


Scolarité 
TOTAL 
0-7 ans 8 ans ou plus 
Recensement canadien 242 187 307 544 549 731 
1971 
Enquête sur les vacances 162 625 787 


1978 


Quelle est votre conclusion ? 


Dans une étude célèbre, des données ont été prélevées sur 6 587 
suicides en France. Voici la distribution des suicides selon le jour de la 
semaine : 


Jour L M M J V S D TOTAL 


Effectif 1 001 1 035 982 1 033 905 737 894 6 587 


a) Testez l'hypothèse selon laquelle les suicides se répartissent 
uniformément sur les jours de la semaine. 


b) Selon une certaine conjecture, les taux de suicide diminuent à 
l'approche d'un week-end. Plus précisément, le taux quotidien global 
pour l'ensemble des jours du vendredi au dimanche est inférieur au 
taux quotidien global pour l'ensemble des jours du lundi au jeudi. 
Est-ce que cette conjecture est vérifiée par les données ? 


c) Testez l'hypothèse selon laquelle chacun des jours du lundi au jeudi 
a le même taux de suicide. 


d) Testez l'hypothèse selon laquelle chacun des jours du vendredi au 
dimanche a le même taux de suicide. 


e)] Essayez de résumer en une phrase ou deux l'ensemble des 
conclusions tirées ci-dessus. 


Vacances et tourisme, Cahier no 3, Centre de recherches urbaines et régionales, les Presses de l'Université du 
Québec. 


24. 


*25. 


1 Distributions 35 


On affirme souvent que la qualité d'un produit manufacturé dépend du 
jour de la semaine où il a été fabriqué. Des données sont prélevées pour 
voir si c'est bien vrai. Au cours d'une longue période, on inspecte la 
production de 500 000 appareils de radio produits dans la même usine : 
90 000 ont été produits un lundi, 109 000 un mardi, 106 000 un 
mercredi, 105 000 un jeudi et 90 000 un vendredi. De ces 500 000 
appareils, 800 ont été trouvés défectueux. Les 800 appareils défectueux 
se répartissent comme ceci : lundi, 200 ; mardi, 144 ; mercredi, 128 ; 
jeudi, 136 ; vendredi, 192. 


a) Testez l'hypothèse selon laquelle le taux de défectuosité est le même 
pour tous les jours de la semaine. 


b) Testez l'hypothèse selon laquelle le taux de défectuosité est le même 
le lundi et le vendredi. 


c) Testez l'hypothèse selon laquelle le taux de défectuosité est le même 
le mardi, le mercredi et le jeudi. 


d) Testez l'hypothèse selon laquelle le taux quotidien global de 
défectuosité le lundi et le vendredi est le même que le taux quotidien 
global du mardi au jeudi. 


Les parts du marché de 4 grandes marques de détergent, À, B, C et D 
sont, respectivement, de 10 %, 20 %, 30 % et 10 % ; une multitude 
d'autres compagnies se partagent les 30 % qui restent. Le fabricant de la 
marque À mène depuis plusieurs mois une campagne publicitaire dans le 
magazine X. Pour évaluer l'effet de cette publicité, il prélève un 
échantillon de 500 lecteurs du magazine X, les interroge sur la marque 
de savon qu'ils utilisent, et obtient les résultats suivants : 


Marque A B C D Autres TOTAL 
Effectif 80 100 130 50 140 500 


a) Supposons qu'une seule question intéresse le fabricant de la marque 
À : « Les lecteurs du magazine X emploient-ils le savon A en plus 
grande proportion que l'ensemble des consommateurs ? » Faïtes un 
test pour répondre à cette question. 


b) Supposons qu'en a) vous avez conclu que les lecteurs du magazine X 
utilisent effectivement le savon À en plus grande proportion. Est-ce 
qu'on peut conclure que la publicité a un effet, ou bien est-ce que des 
doutes raisonnables persistent ? 


36 


Introduction à la statistique appliquée 


c) Supposons qu'en fait les lecteurs du magazine X emploient en plus 
grande proportion le savon À, et supposons que ce sont les annonces 
qui les ont attirés vers ce produit. Un analyste, en examinant les 
données du tableau ci-dessus, conclut que ce sont surtout les 
utilisateurs du savon C qui ont été attirés vers le savon A. Faïtes un 
test pour savoir si cette conclusion est justifiée. 


*26. Au cours d'une négociation, la partie patronale affirme que les employés 


abusent des congés de maladie. Pour appuyer cette affirmation, elle 
présente les données suivantes, qui représentent la répartition de 500 
absences d'un jour, chacune sous prétexte de maladie. (Le patron a 
délibérément omis tous les cas d'absence de plus d'un jour à la fois, car 
il est prêt à concéder que ceux-là sont réellement dus à des maladies). 


Jour L M M J V TOTAL 


Effectif 129 80 82 81 128 500 


Le patron fait remarquer que les absences sont particulièrement 
fréquentes les lundis et vendredis, ce qui laisse soupçonner que dans 
certains cas les absences n'avaient pour motif que celui de prolonger un 
week-end. 


a) Faites un test pour déterminer si les absences sont réellement plus 
fréquentes les lundis et vendredis. 


b) Le syndicat accepte le résultat en (a), mais il réplique que cela ne 
démontre pas qu'il y ait eu des abus. Son argument : il rappelle que 
seules les absences d'un jour ont été retenues -— les absences de deux 
jours consécutifs ou plus ont été omises, y compris celles du vendredi 
au lundi suivant. Donc, les absences du mardi, du mercredi et du 
jeudi représentent des maladies qui ont duré un seul jour, alors que 
les absences du lundi et du vendredi comptent non seulement des 
maladies d'un jour mais également des maladies de 2 jours et de 3 
jours. Le syndicat prélève alors des données sur la durée d'une 
maladie mineure et trouve la distribution suivante : 


Durée (en jours) 1 2 3 4 TOTAL 
Fréquence 0,5 0,2 0,1 0,2 1 


Faites un test qui permet de démolir l'argument du patron. 


Mesures de tendance 
centrale et de dispersion 


2.1 


2.2 


2.3 


2.4 
2.5 
2.6 


Mesures de tendance centrale 

+ La moyenne arithmétique 

+ Le mode 

+ La médiane 

+ Les quantiles 

Mesures de dispersion 

+ La variance 

+ Calcul de la variance 

+ L'écart interquartile 

Cas d'une distribution 

+ Le mode 

+ La médiane et les quantiles 

+ La moyenne arithmétique 

+ La variance 

+ Les moustaches 
Transformation linéaire 

Variable centrée réduite ou cote Z 
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RÉSUMÉ 
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Introduction L'histogramme et le polygone des fréquences permettent de 
visualiser aisément les caractéristiques essentielles d'une distribution. Ils 
nous permettent d'identifier approximativement le point autour duquel les 
valeurs se concentrent et dans quelle mesure elles se dispersent, de voir si la 
distribution est symétrique ou non. Cependant, toute cette information, 
qu'un graphique permet de saisir en un coup d'oeil, est nécessairement 
imprécise. Nous attacherons donc une importance particulière aux 
caractéristiques que l'on peut mesurer. Une de ces caractéristiques est la 
tendance centrale ; une autre est la dispersion. 


2.1 


MESURES DE TENDANCE CENTRALE 


La tendance centrale d'une distribution est la valeur autour de laquelle se 
concentrent en général les données. Il y a plusieurs façons de rendre cette 
notion précise, c'est-à-dire, de la mesurer. Nous présentons ici quatre 
mesures de tendance centrale : la moyenne arithmétique, le mode, la 
médiane et les quantiles. Chacune de ces mesures répond à sa façon à la 
question trop vague : quel est l'ordre de grandeur d'une donnée « typique » ? 


La moyenne arithmétique La mesure de tendance centrale la mieux connue et 
la plus importante est la moyenne arithmétique, ou moyenne tout court. 
Étant donné n nombres x,,x, x, leur moyenne arithmétique x est définie 


par : 


En mots, la moyenne arithmétique est la somme des données, divisée par le 
nombre de données. 


Remarque La notation Y (sigma) est expliquée en annexe pour ceux qui ne la 
connaissent pas. Pour simplifier la notation nous nous permettrons, lorsque 
cela ne risque pas de créer d'ambiguiïtés, d'omettre l'indice et les bornes de 
sommation. Ainsi, nous écrirons : 


> n 
x, ou x au lieu de Dr ou Ne 
= 


Exemple 1 
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Dans une rue où habitent 21 ménages, on prend note du nombre d'enfants 
dans chaque ménage. On obtient les données suivantes : 


OÙ L Ad de HE 1 2% 2 2 2.2.2; «2. 2; 2:72 2: ,8.,3% 4 
La moyenne arithmétique du nombre d'enfants est : 
LL  O+1+1+1+1+1+1+2+2+2+2+2+2+2+2+2+2+2+3+3+4 
= 
21 


38 
21 
= 1,8 


Le nombre moyen d'enfants est de 1,8. La figure 2.1 illustre la distribution 
du nombre d'enfants. La position de la moyenne montre bien qu'il s'agit d'un 
nombre autour duquel les données se concentrent. + 


La notion de moyenne présente beaucoup d'analogies avec la notion de 
centre de gravité que l'on rencontre en physique. Si l'on imagine que chaque 
bâton d'un diagramme a une masse proportionnelle à sa hauteur et que l'on 
désire que le diagramme puisse se tenir en équilibre sur un pivot placé sous 
l'abscisse, c'est sous x que le pivot doit être placé. 


Le mode Dans la figure 2.1, on constate que la valeur « 2 » est très fréquente, 
et on pourrait bien vouloir la considérer comme valeur centrale. Ce genre de 
situation se répète assez souvent pour justifier l'introduction d'une nouvelle 
mesure de tendance centrale, le mode. Le mode est la valeur de la variable 
ayant la plus grande fréquence. 
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FIGURE 2.1 


Exemple 2 


Exemple 3 


Exemple 4 


Distribution du nombre d'enfants 


12 
10 


Nombre de ménages 


O NN À oo œ 


() 1 1 2 3 4 


Nombre d'enfants 


Le mode ne se révèle utile que lorsqu'il est plutôt prononcé, sinon il joue mal 
son rôle de mesure de tendance centrale. Considérez les données suivantes : 


3 3 14 15 16 17 18 19 20 


Leur mode est 3, mais on peut difficilement dire que c'est une valeur centrale 
ou une valeur représentative de l'ensemble des données. + 


Le mode a l'avantage d'être utilisable avec les données qualitatives. Aïnsi la 
variable « langue maternelle » au Québec a pour mode le « français ». + 


Dans certaines situations, ni le mode ni la moyenne arithmétique ne peuvent 
servir de mesure de tendance centrale. Considérez les revenus annuels de 
douze ouvriers et celui du propriétaire d'une usine (en milliers de dollars) : 


24,0 24,4 24,8 25,0 25,6 26,2 26,4 27,0 27,2 27,6 28,0 28,4 157,5 


Chaque donnée est un mode, de sorte que cette mesure est ici sans intérêt. 
Quant à la moyenne arithmétique, elle vaut 36,3, un nombre éloigné de 
toutes les données. L'utilisation d'une autre mesure de tendance centrale 
semble ici souhaitable. + 


Remarque Îl arrive parfois que deux ou plusieurs valeurs soient les plus 
fréquentes, ex æquo. Chacune de ces valeurs est alors un mode et on a affaire 
à une distribution bimodale ou multimodale. 
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La médiane La médiane est la donnée qui se situe au centre de la série 
lorsque celle-ci est écrite en ordre croissant ou décroissant. Par exemple, la 
médiane des données 

2 5 6 9 11 


est 6. Lorsque le nombre de données est pair, on définit la médiane comme 
la moyenne arithmétique entre les deux données centrales. Par exemple, la 
médiane des données 

1 2 4 6 8 9 13 14 17 20 


est 


L'avantage principal de la médiane, par rapport à la moyenne arithmétique, 
est qu'elle n'est pas indûment influencée par quelques données extrêmes. La 
médiane des données de l'exemple 4 est 26,4, une valeur plus raisonnable 
que la moyenne arithmétique de 36,3. 

Les quantiles La médiane sépare l'ensemble de toutes les valeurs de la 
variable en deux groupes d'égale fréquence (soit M). Il s'avère intéressant de 


généraliser ce concept pour obtenir des points qui divisent les valeurs en n 
groupes d'égale fréquence. C'est ainsi qu'on obtient la notion de quantile. 


De façon générale, si à est un nombre compris entre O et 1, le quantile 
d'ordre « est le point tel qu'une proportion « des données se trouve « en 
dessous » et une proportion 1-a se trouve « au-dessus ». En pratique, on 
utilise les quantiles suivants : 


e les quartiles Q1, Q, Q3 qui sont les quantiles d'ordre % , #, %,. Notons 


que Q n'est autre que la médiane ; 


e les déciles D:, D2, …, De qui sont les quantiles d'ordre Y,, %6,.…., %o ; 


e les centiles C1, C2, .…, Coo qui sont les quantiles d'ordre 5, 260: °%/00 : 
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Exemple 5 


Considérons les 27 données suivantes : 
11233445555556667 778 9 9 9 9 9 9 9 
Alors Q1 = 4, Q = 6, O3 = 9. En effet, Q1 est la 7° donnée, Q: est la 14° et Os 


la 21°. En général, on se convaincra aisément que, quand les n données sont 
ordonnées, le quantile d'ordre «a est 


e soit la donnée dont le rang est l'entier le plus près de an ++ ; 
e soit, si an est entier, la moyenne des données de rangs respectifs an 
et an+1. + 
2.2 MESURES DE DISPERSION 


Exemple 6 


Exemple 7 


Exemple 8 


Une moyenne donne l'ordre de grandeur d'un ensemble de données, mais 
cette information se révèle presque toujours insuffisante. Considérez, par 
exemple, une classe dont la moyenne à un examen est 60. Cette classe peut 
être formée presque entièrement d'élèves très faibles et d'élèves très forts. Le 
nombre « 60 » n'étant qu'une moyenne, il peut cacher plusieurs réalités. Un 
indice de la dispersion des données par rapport à la moyenne s'impose. 


On se convaincra, dans les trois exemples qui suivent, qu'une moyenne qui 
n'est pas accompagnée d'un indice de dispersion est beaucoup moins 
éloquente. 


Un patient apprend de son médecin que sa pression intra-oculaire est de 19 
alors que la pression moyenne pour ceux de son âge et de son sexe est 
de 17. Que peut-il conclure ? Le fait que ce patient s'écarte de la moyenne 
n'est pas nécessairement inquiétant, puisqu'en général, les données d'une 
population sont presque toutes distinctes de la moyenne. Mais s'écarte-t-il 
trop de la moyenne ? Pour le savoir, il faudrait qu'il sache de combien les 
autres membres de la population s'écartent de la moyenne. En d'autres 
termes, il lui faut une mesure de la dispersion des données par rapport à la 
moyenne. + 


La température moyenne à Montréal est de 6,9°C. Cela n'empêche pas la 
température de baisser à — 30°C en hiver et de monter à 30°C en été. + 


Le service d'urgence d'un hôpital traite en moyenne 5 patients par heure. 
Puisque la dispersion du nombre d'arrivées de malades ou de blessés est en 
général très grande, il se peut très bien que, durant une certaine heure, il n'y 


Exemple 9 
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ait qu'une seule arrivée ou même aucune et que, durant l'heure suivante il y 
en ait 10 ou 15. Si l'on veut éviter que le service soit trop souvent débordé, 
on doit l'organiser de telle sorte qu'il soit en mesure de traiter, par moments, 
beaucoup plus que 5 patients par heure. La demande moyenne d'un service 
est un indice inadéquat des ressources nécessaires à sa prestation. + 


La variance Soit x, x2, …, xn une série de n données et x leur moyenne. La 
variance s2 de ces données est la moyenne arithmétique des carrés des 
écarts à la moyenne : 


HD 


n 


L'écart-type s est la racine carrée de la variance : 


JE ES 


n 


C'est l'écart-type que nous utiliserons comme mesure de dispersion. 


Les données 
3 4 4 4 6 9 


ont pour moyenne x = 5. Leur variance est (voir le tableau 2.1 qui illustre les 
calculs) : 


L (3-5) +(4-5) +(4-5)" +(4-5) +(6-5)" +(9-5)° 
6 


2 
S 


4+1+1+1+1+16 
6 


4 
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TABLEAU 2.1 Calcul de s2 


X; X, —X (82 — X) 

3 =) 4 

4 = 1 

4 si 1 

4 “| 1 

6 1 1 

9 4 16 
Z(x, -x)° = 24 


FIGURE 2.2 Distribution des données 


Effectifs 


Leur écart-type est donc: s= V4 =2 


La figure 2.2 illustre la distribution de ces données au moyen d'un 
diagramme à bâtons. L'abscisse du graphique a été graduée en utilisant x et 
s afin de bien montrer leur rôle respectif dans la description numérique de la 
distribution. + 
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L'interprétation de la valeur d'un écart-type n'est pas aussi aisée que celle 
d'une moyenne. En comparant les écarts-types de deux séries de données, 
on peut arriver à certaines conclusions qualitatives. 


Exemple 10 Voici les revenus moyens des familles pour 5 régions du Canada, en 1951 et 
en 1978 en dollars constants (1971) : 


ne : x ; Lu Colombie- 
Région Atlantique Québec Ontario Prairies Britannique 

1951 3 810 5 337 5 913 4 940 5 559 

1978 9 744 11 569 12 921 12 129 13 320 


L'écart-type est de 723,44 $ en 1951 et de 1 253,99 $ en 1978. Puisque 
l'écart-type est ici une mesure des disparités entre les régions, on peut 
conclure que ces disparités se sont élargies entre 1951 et 1978. Il faut noter, 
cependant, que même en dollars constants, les revenus sont en moyenne 
beaucoup plus élevés en 1978. On trouve en effet x= 5 111,80 $ en 1951 et 
x = 11 936,60 $ en 1978. 


Même si, numériquement, l'écart-type est plus grand en 1978 qu'en 1951, 
on observe cependant que l'écart-type relatif s/X qui était de 0,142 en 1951 


n'était plus que de 0,105 en 1978. Les valeurs de 1978 sont donc 
relativement moins dispersées que celles de 1951. + 


En somme, la comparaison des écart-types doit être relativisée pour les 
ordres de grandeur ; après tout, exprimés en grammes, les poids d'un 
échantillon d'éléphants seront infiniment plus dispersés que ceux d'un 
échantillon de souris... ce qui ne veut pas dire qu'« en soi » les poids des 
éléphants sont plus dispersés que ceux des souris. 


Calcul de la variance La formule 
re > (x, 2) 


n 


pour la variance d'une série de données constitue la définition de la variance 
et elle montre clairement ce que la variance mesure. Comme formule de 
calcul, cependant, elle ne se révèle pas très pratique. D'autres formules, 
équivalentes à celle-ci, sont en général plus faciles à utiliser. En voici 
quelques-unes : 
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TABLEAU 2.2 


Calcul d'une variance 


OO +R R ww ns 
O 


> 30 174 


Ainsi, par exemple, 


, DD x) /n 174-900/6 174-150 ’ 
n 6 6 


S 


Remarque Si l'on dispose d'une calculatrice qui possède au moins deux 
mémoires, l'emploi de ces dernières formules évite d'avoir à introduire deux 
fois la liste des observations. On peut en effet affecter une mémoire au calcul 
de en et une autre à celui de Xx,. Ces deux sommes, convenablement 


traitées, permettent d'obtenir rapidement la variance s°. Cette procédure est 
schématisée par le tableau 2.2 (où l'on reprend les données de l'exemple 9). 


Remarque Une mise en garde s'impose : ne jamais arrondir trop tôt les 
résultats intermédiaires. L'exemple 11 illustre le genre de péril auquel on 


. = 2 
s'expose en arrondissant trop la valeur de x dans le calcul de s°. 
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Exemple 11 Considérons les trois observations suivantes : 


Exemple 12 


136 137 139 


Un calcul rapide donne x = 137,333 3 … et x* = 18 862. On obtient donc 
s° 2H =1,555 5.., ce qui est correct. Si l'on arrondit x à 137,3, on 
trouve s° =18862-(137,3) =10,71, valeur près de 7 fois trop grande et 
carrément erronée. Une imprécision apparemment anodine sur la valeur de 
x peut facilement ruiner, comme on le voit, le calcul de s°. + 


Remarque On aura sans doute trouvé « naturelle » notre définition de la vari- 


Il 
ance comme une sorte de moyenne (—) des carrés des écarts à la moyenne 
n 


(EAST )). Certains auteurs et certains fabricants de calculatrices, toutefois, 


utilisent plutôt un facteur « » dans cette définition. Nous reviendrons au 


n-l 
chapitre 8 sur les raisons techniques, qui motivent le choix de l'une ou l'autre 
de ces formules. Qu'il vous suffise, pour l'instant, de vérifier quelle formule est 
utilisée dans votre calculatrice. 


L'écart interquartile 11 arrive que l'information donnée par x et s ne fournisse 
pas un portrait aussi précis qu'on le voudrait de la réalité : c'est 
particulièrement vrai lorsqu'il y a plusieurs données « extrêmes » ou quand la 
distribution est très peu symétrique. On utilise alors l'écart interquartile, E, 
défini par 

E= Q3-0Q: 


Les deux exemples qui suivent montrent bien comment l'écart interquartile 
mesure la dispersion de la population, en évaluant la largeur de l'intervalle 
qui contient la moitié des valeurs et en négligeant les valeurs extrêmes. 


Considérons les données suivantes : 

2 2 2 2 3 4 4 5 22 
Selon la règle énoncée à la page 42, le rang du 1: quartile est l'entier le plus 
près de 9/4 + 1/2, soit 3. On voit que Q1 = 2, @ = 3 et Q3 = 4. Donc 
E=4-2=-2. + 
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Exemple 13 


Avec les données suivantes, 
—8 1 2 3 4 5 6 7 722 


on trouve, en procédant de façon analogue, 


E=Q@:-Q=6-2-4. + 


Remarque On utilise quelquefois, mais beaucoup plus rarement, l'écart 
interdécile (Do -— Di) et l'écart intercentile (C99 — Ci). 


2.3 


Exemple 14 


CAS D'UNE DISTRIBUTION 


Dans les sections précédentes, on a défini les mesures de tendance centrale 


et de dispersion pour une série de données x, x,.…., x,. Ces notions 


s'appliquent également aux distributions, puisque la différence entre une dis- 
tribution et une série de données est une simple question de présentation. 


Considérons la distribution suivante du nombre d'enfants dans les ménages 
d'une rue : 


Nombre d'enfants 0 1 2 3 4 TOTAL 


Effectif 1 6 11 2 1 21 


On peut déterminer les mesures de tendance centrale et de dispersion à 
l'aide des définitions et formules des sections précédentes ; il suffit de 
présenter cette distribution sous sa forme originale, celle d'une série de 
données : 

011111122222222222 334 


En pratique, cette opération est inutile, souvent très laborieuse et parfois 
impossible. On peut trouver directement les mesures de tendance centrale et 
de dispersion à l'aide de procédés ou de formules que l'on déduit facilement 
de ceux des sections précédentes. + 


Le mode Le mode se trouve plus aisément à partir d'une distribution qu'à 
partir d'une série de données. Dans l'exemple 14, le mode est évidemment 2, 
car cette valeur, observée 11 fois, est la plus fréquente. 


Exemple 15 
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Dans le cas d'une distribution où les valeurs sont groupées, nous ne 
parlerons pas de mode, mais plutôt de classe modale. Si les classes sont 
toutes de même largeur, la classe modale est celle qui a le plus grand effectif 
ou la plus grande fréquence. Si les classes sont de largeur variable, on se 
réfère à l'histogramme et la classe modale correspond alors au rectangle le 
plus élevé. Dans l'exemple illustré par la figure 1.5 (page 12), la classe 
modale est l'intervalle (20, 25), même si la classe (25, 35), qui est deux fois 
plus large, a un effectif supérieur. 


La médiane et les quantiles On peut repérer la donnée centrale ou les 
données centrales sans ranger les données en série. Dans l'exemple 14, on 
sait que la médiane est la 11° donnée. La première est un « O » ; les 6 
suivantes sont des « 1 » ; ensuite, de la huitième à la dix-huitième, les 
données sont des « 2 ». Donc, la onzième donnée est un « 2 », et c'est la 
médiane. De façon tout à fait analogue, on voit que le 1er quartile O1 est « 1 », 
et le 3°, O3, est « 2 ». 


Pour les valeurs groupées, la médiane et les divers quantiles peuvent être 
estimés, par interpolation. Comme l'illustre l'exemple 15, l'idée de base con- 
siste à faire comme si les observations de chaque classe étaient uniformément 
réparties dans cette classe. Graphiquement, après avoir identifié la classe 
contenant la médiane ou le quantile cherché, il suffit de déterminer à quel 
endroit il faut découper l'histogramme pour que la surface de la partie 
gauche représente exactement la proportion désirée de la population. 


Supposons que l'on cherche ©: et Q3 de la distribution suivante : 


x O<x<S5 S<x<10 I0<x<IS I15<x<20 20<x<725 


Fréquence 0,10 0,17 0,34 0,31 0,08 


On voit immédiatement que Q1 est dans la deuxième classe, Q3 dans la 
quatrième. En effet, puisque les trois premières classes contiennent une 
proportion totale de 61 % de la population et les quatre premières 92 %, c'est 
donc dans le quatrième que se situe le point sous lequel il y a 75 % de la 
population, c'est-à-dire O3. 
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Recherche de Q:1 


Présentons d'abord le problème graphiquement : 


FIGURE 2.3 


0 5 10 15 20 25 
O1 
On voit que la répartition de l'aire ombragée correspond à l'équation sui- 
vante : 


0,25 = (aire du le rectangle) + (aire de la partie du 2° rectangle à gauche de 
Qi). 


Le rapport de cette dernière aire sur l'aire totale du 2° rectangle (soit 0,17) 
est égal au rapport de la longueur Q: — 5 sur la longueur (5) de la base. 
L'équation peut donc se récrire 


0,25 = 0,10 + (0,17). 


Q, —S 
5 
Après quelques manipulations algébriques, on trouve 
5(0,25-0,10) 
= ———— +5 
0,17 
z 9,41. 
Recherche de Q: 
Un raisonnement et un calcul analogues nous donnent 
5(0,75 —0,61) 
+15 &:17, 26 
0,31 


On notera que le terme 0,61 correspond à la fréquence totale des classes qui 
précèdent la quatrième. + 


Exemple 16 
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La moyenne arithmétique Soit x, x,, …, x,, les valeurs distinctes d'une 


variable, n,, n,, .…, n, les effectifs correspondants, et LED Alors la 


moyenne arithmétique est donnée par : 


n 


Considérons les données de l'exemple 14 ; on peut les présenter en un 
tableau : 


X: ñ; X;h; 
0 1 0 
1 6 6 
2 11 LD, 
3 6 
4 4 
TOTAL 21 38 


Donc x =38/21+1,8. 


Remarquez que la formule ci-dessus peut s'écrire 


Posons f =n,/n; f, est la fréquence de la valeur x. On peut calculer la 


moyenne arithmétique à partir des fréquences seulement : les effectifs ne 
sont pas indispensables. Si f, f,,.…, f, sont les fréquences des valeurs x,, 


x, ,.…, X,, alors la moyenne arithmétique est donnée par : 


F=D x 


Lorsque les valeurs sont groupées, les mêmes formules s'appliquent, sauf 
qu'alors les x, représentent les points milieux des classes. Dans ce cas, la 


valeur qu'on obtient pour x n'est qu'une approximation de la véritable 
moyenne. On a dû faire comme si les observations de chaque classe étaient 
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uniformément réparties à l'intérieur de cette classe (ou comme si elles 
étaient toutes concentrées au centre de la classe). Avec des données 
groupées, c'est le mieux qu'on puisse faire. Il va de soi que si l'une des 
classes extrêmes se rend jusqu'à l'infini, son point milieu doit être remplacé 
par une valeur raisonnable. 


js 1e IS 


La variance Soit x, x 


effectifs et f, f,,…, f,les fréquences. On peut déduire plusieurs formules 


,»-., *, les valeurs d'une variable,n,, n 


pour la variance des formules de la section précédente : 
—\2 
2 Z(x; x) n, 
n 
DORE 
Lxn, (Ex, ) /n 


S 


Exemple 17 Voici la distribution du revenu familial de 1 000 Québécois dont le revenu, 


en 1981, était compris entre 2 000 $ et 25 000 $. 


(en ee es Point milieu Effectif Fréquence 
2<x<4 3,0 100 0,100 
4A<x<6 5,0 116 0,116 
6<x< 10 8,0 177 0,177 

10<x<15 12,5 225 0,225 
15 < x < 20 17,5 217 0,217 
20 < x < 25 22,5 165 0,165 

1 000 1,000 


La figure 2.4 représente l'histogramme de cette distribution : 
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Distribution du revenu familial de 1 000 Québécois 


100 116 I 225 217 165 


| Î Î | Î Ï Ï | 
0 2 4 6 10 15 20 25 


Comme le montre clairement l'histogramme, c'est la classe (4, 6) qui est la 
classe modale même si ce n'est pas cette classe qui a reçu le plus 
d'observations. En effet, les six classes étant de largeur respective 2, 2, 4,5, 
5 et 5, les hauteurs des rectangles de l'histogramme sont respectivement 
proportionnelles à : 

50 58 4425 45 43,4 33 


C'est donc le second rectangle qui est le plus haut. 
La moyenne arithmétique peut être estimée par 
DER 
n 
(3x100)+(5x116)+(8x177)+(12,5x225)+(17,5x217)+(22,5x165) 
: 1 000 


X = 


12 618,5 
1 000 
=12,618 5 


ou encore par : 

x=Xx.f, 
= (3x0,100)+(5x0,116)+(8x0,177)+(12,5x0,225)+(17,5x0,217)+(22,5 x 0,165) 
AD GISS 
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De même, x° peut être estimé par : 
os 
= (3° x0,100)+ (5° x0,116)+(8° x0,177)+(12,5° x0,225)+(17,5° x0,217) 


+(22,5° x 0,165) 
= 200,271 75 


On obtient donc 5° = x? - x? = 41,045 2 et s = Vs? = 6,406 7. 
+ 


Rappelons encore que la moyenne et la variance calculées à partir de 
données groupées ne constituent que des approximations des valeurs 
véritables qui, elles, sont inaccessibles puisqu'on ne dispose pas de la liste 
détaillée de toutes les observations individuelles. 


Les moustaches Les techniques descriptives représentent toujours un 
compromis : entre la nécessité de condenser les données et celle de préserver 
l'information, et entre l'attrait visuel d'un dessin et la précision des mesures 
numériques. On peut imaginer plusieurs présentations intermédiaires entre 
la distribution complète, d'une part, et une ou deux mesures statistiques, 
d'autre part. Une tendance moderne consiste à résumer les données par cinq 
indices : le centre des données, leurs limites et les limites de la moitié 
centrale des données. Le choix le plus naturel serait la médiane, les limites 
inférieure et supérieure des données, et le premier et troisième quartiles. 
Aïnsi, on séparerait la distribution en quatre classes de fréquences égales. 


Cette approche est attrayante par sa simplicité et s'avère satisfaisante dans 
la plupart des cas. Nous ne la présentons pas ici, cependant, car elle est un 
peu trop simple : elle peut à l'occasion cacher certaines caractéristiques qui 
méritent d'être mises en évidence. En particulier, elle ne permet pas de 
détecter des données exceptionnelles -— extrêmement grandes ou 
extrêmement petites. De telles données sont significatives et on a intérêt à 
les isoler et à les examiner de près. 


2 Mesures de tendance centrale et de dispersion 55 


Considérons les données suivantes, qui représentent les revenus annuels, en 
milliers de dollars, de 29 fermes : 


1,3 4,5 22,2 33,5 49,2 71,1 
be 9,4 24,8 37,5 58,3 85,9 
1,9 10,3 29,0 38,7 60,9 169,3 
3,1 10,4 29,5 44,4 61,8 181,6 
42 517 29,7 46,3 70,0 


Ces données sont présentées dans l'histogramme de la figure 2.5, dans 
lequel on voit que certaines des données sont excessivement grandes. La 
médiane n'est pas affectée par ces données extrêmes ; ce sera donc le 
premier repère. La médiane est la 15° donnée, soit 29,7. 


Il serait naturel ensuite de considérer Q1 et O3: comme autres repères. Mais 
pour des raisons que nous ne discuterons pas ici, nous choisirons plutôt 
deux autres points, généralement assez semblables à Q1, et O3, que nous 
appellerons charnières. Ce sont les médianes des deux moitiés de données 
séparées par la médiane. La situation est schématisée par la droite suivante, 
où l'échelle est celle des rangs et non celle des données : 

Donnée 1,3 10,3 29,7 58,3 181,6 


Rang Il 8 15 22 29 
L'une des charnières est la médiane des données de rang 1 à 15, l'autre est 
celle des données de rang 15 à 29. Ce sont donc les données de rang 8 et de 
rang 22, soit 10,3 et 58,3. Les chiffres 10,3 ; 29,7 et 58,3 situent les données 
centrales. 
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FIGURE 2.5 
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Nous devons ensuite déterminer des nombres qui situent les extrémités de la 
distribution. Comme nous l'avons dit plus haut, la plus petite et la plus 
grande données pourraient servir, 1,3 et 181,6 dans l'exemple. Mais nous ne 
sommes pas très satisfaits du chiffre 181,6: c'est bien la plus grande 
donnée, mais elle est beaucoup trop grande. La présenter comme limite, c'est 
cacher le fait que très peu de données sont de cet ordre de grandeur. Nous 
cherchons plutôt des limites « normales », donc des points qui ne s'éloignent 
pas trop des charnières. Pour des raisons théoriques, nous définirons une 
distance normale comme une distance qui ne dépasse pas une fois et demie 
l'écart entre les charnières. Dans les données ci-dessus, l'écart entre les 
charnières est 


58,3 -10,3 = 48 
et donc un écart normal aux charnières est 


1,5x48=72. 


Toutes les données qui s'écartent de la charnière la plus proche de plus de 
72 seront considérées anormales et donc isolées. L'intervalle à l'intérieur 
duquel toutes les données sont normales est donc 


(10,3-72; 58,3+72), 
soit (-61,7: 130,3). 
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FIGURE 2.6 Moustache représentant les revenus annuels de 29 fermes (en milliers de dollars) 
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Nous n'allons pas nous en tenir à ces limites, pour des raisons évidentes la 
première limite est négative, ce qui n'a pas de sens ; et les deux sont trop 
éloignées des données contenues dans l'intervalle. Nous présenterons plutôt 
la plus petite donnée et la plus grande donnée comprises dans cet intervalle. 
La plus petite donnée dans l'intervalle (-61,7 ; 130,3) est 1,3 ; la plus grande 
est 85,9. Nous présenterons donc, en définitive, les cinq repères suivants : 


1,3; 10,3; 29,7; 58,3; 85,9. 
Nous ajoutons à cela l'information qu'il y a deux données extrêmes, soit : 
169,3 et 181,6 


Ces chiffres — les cinq repères et les deux données extrêmes - peuvent être 
présentés dans un graphique comme celui de la figure 2.6, un type de 
graphique que nous appelons moustache. Le rectangle, dont les côtés 
gauche et droit représentent les deux charnières, est divisé par une droite 
verticale située au niveau de la médiane. Des tiges s'étendent vers la gauche 
et vers la droite, la première aboutissant à la limite inférieure 1,3; la 
seconde à la limite supérieure 85,9. 


Une moustache révèle les caractéristiques essentielles d'une distribution : le 
rectangle est long ou court selon que les données sont concentrées ou 
dispersées ; la position du rectangle est celle de la partie centrale des 
données. En particulier, lorsque la distribution est symétrique, la barre se 
trouve en plein centre et ses deux parties sont égales. Maïs une moustache 
n'est pas uniquement visuelle : une échelle permet de repérer les cinq 
indices et les données extrêmes. La moustache permet de voir qu'environ la 
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moitié centrale des données se situe entre 10,3 et 58,3 (ou à peu près, selon 
le détail de l'échelle) ; que presque toutes les données sont entre 1,3 et 85,9 ; 
et que celles qui ne s'y trouvent pas sont 169,3 et 181,6. 


Dans n'importe quelle analyse, des données telles que ces deux dernières ne 
doivent pas passer inaperçues. Dans cet exemple, nous devrions tenter 
d'expliquer pourquoi ces fermes sont si grandes comparées aux autres. Les 
chiffres sont-ils erronés ? Si non, s'agit-il d'une autre forme de culture ? 
S'agit-il de fermes coopératives ou corporatives ? Si oui, devrait-on traiter 
cette catégorie comme une strate à part ? Seul le contexte permet d'expliquer 
ces données ; mais la moustache a permis de les signaler. 


Remarque Lorsque le nombre de données est impair, la médiane intervient 
dans le calcul des deux charnières. Sinon, les charnières sont calculées à 
partir de deux moitiés disjointes. Le calcul des médianes se fait selon les 
conventions établies à la section 2.1. Lorsque le nombre de données est pair, 
la médiane est la moyenne arithmétique des deux données centrales. Cela 
s'applique aussi bien au calcul des charnières qu'à celui de la médiane de 
l'ensemble des données. 


2.4 


TRANSFORMATION LINÉAIRE 


Le passage des degrés Fahrenheit aux degrés Celsius, la relation entre les 
valeurs respectives de deux monnaies, la relation entre la distance 
parcourue par un taxi et le montant indiqué au compteur ne constituent que 
trois exemples d'une des transformations mathématiques les plus utilisées. 
De façon générale, soit X une variable, a et b deux constantes et soit Y une 
variable définie en fonction de X par l'équation 


Y=a+bX. 


Cette transformation linéaire associe à chaque valeur x: de X une valeur 
yi de Ÿ par le calcul y: = a +bxi. Alors la moyenne et la variance de chacune 


des deux variables sont données en fonction l'une de l'autre par 


y=a+bx 


2 22 
et par Sy =b°sz. 


Exemple 18 
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De cette dernière équation on obtient l'écart-type de Y: 
Sy = |b|s ” 
où |bl est la valeur absolue de b. 
Soit X le salaire des employés d'une compagnie. Supposons que x = 18 500 $ 
et s = 2 000 $. Supposons que chaque employé recevra l'année prochaine une 
augmentation de 15 % du salaire, plus un montant forfaitaire de 1000 $. Soit 


Y le revenu des employés l'année prochaine. Chaque salaire xi se verra 
transformé en un revenu y: calculé comme ceci : 


y, =1000+1,15x, 


En d'autres termes, la variable Y est liée à la variable X par l'équation 
Y =1000+1,15X 
Donc, l'année prochaine, le revenu moyen des employés sera : 
y =1000+1,15x 
= 1000+1,15(18 500) = 22 275 


L'écart-type sera : 


=D) 


=1,15(2 000) 
= 2 300 


2.5 


VARIABLE CENTRÉE RÉDUITE OU COTE Z 


La transformation linéaire particulière que nous étudions ici est souvent 
utile ; elle permet de passer d'une variable X à une variable Z centrée 
réduite, ainsi appelée parce que sa moyenne est O et son écart-type, 1. Soit 
donc une variable X et soit Z une autre variable, définie en fonction de X par 
l'équation 
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Exemple 19 


Notons que Zest souvent appelée la « cote Z » de X. C'est une transformation 
linéaire qu'on peut écrire sous la forme Z = a + bX: 


x 1 
Z=—+| —}|X 
Sy Sy 
La moyenne de Zest donc : 
RONDE 
z = + x=0 
Sy Sy 
. 1 
et son écart-type est : s, =|—{|s,=1 
S 
X 


Vous passez un test psychologique et vous obtenez le score x = 70. Si vous 
ne connaissez pas bien ce test, vous ne pouvez pas interpréter ce résultat. Si 
l'on vous dit que la moyenne de la population est x= 60, vous avez un 
premier élément d'information utile : vous savez que vous vous situez à 
x-x=70-60=10 unités au-dessus de la moyenne. Mais vous ne savez pas 
encore si cet écart à la moyenne est important ou non. Pour pouvoir 
l'évaluer, il faut que vous ayez une mesure de l'écart « typique », et c'est 
précisément ce que mesure l'écart-type. Si l'on vous dit que l'écart-type est 
Sx = 5, alors vous savez que votre écart à la moyenne est de 2 fois l'écart 
typique. Ce chiffre, « 2 », est votre cote Z. Elle s'interprète mieux que le score 
brut de 70. + 


La cote Z s'avère particulièrement utile lorsqu'on traite de variables dont la 
distribution ne nous est pas familière. Il n'est peut-être pas nécessaire de 
calculer une cote Z pour savoir si un Canadien ayant un revenu de 80 000 $ 
par an est aisé ou non. Mais une cote Z serait certainement utile pour situer 
un Russe dont le revenu est de 4 000 roubles par années. Si la cote Z 
correspondant à 4 000 roubles est 2, le Russe se situe à 2 écarts-types au 
dessus de la moyenne et il est plutôt aisé relativement à ses compatriotes. 
En effet, quelle que soit l'unité de mesure originale, une cote Z de 2 
représente une valeur importante. 


En quel sens est-ce important ? C'est important dans le sens où la 
proportion des membres d'une population qui se situe à 2 écarts-types ou 
plus de la moyenne est petite. Ceci découle d'un théorème, dû au 


Exemple 20 


Exemple 21 
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mathématicien russe P. L. Tchebychev, duquel on peut déduire, entre 
autres, qu'à 2 écarts-types ou plus de la moyenne on ne retrouve jamais plus 
de 1/4 = 112 de la population ; qu'à 3 écarts-types ou plus de la moyenne on 


ne retrouve jamais plus de 1/9 _ 1/3° de la population ; et qu'à 4 écarts-types 
ou plus de la moyenne on ne retrouve jamais plus 1/ 16 = 1/ 4 de la 


population. Voici l'énoncé de ce théorème : 


Théorème de Tchebychev : Soit k un nombre supérieur à 1, et soit p la 
proportion des membres de la population dont la cote Z est soit supérieure 
ou égale à k, soit inférieure ou égale à -k. Alors p n'est jamais supérieure à 
1/k2. 


Il convient de préciser que, dans la plupart des cas, la valeur véritable de p 
est beaucoup plus petite que la borne qu'on obtient en utilisant l'inégalité de 
Tchebychev. 


Considérons une variable X de moyenne x= 100 et d'écart-type sx = 10. 
Alors le théorème de Tchebychev permet d'affirmer que : au plus 1/ 2° =1/4 
des individus seront à au moins 2 écarts-types de x, donc hors de l'intervalle 
(80, 120) ; au plus 1/3° =1/9 des individus seront hors de l'intervalle (70, 


130) ; au plus 1/4° = 1/16 des individus seront hors de l'intervalle (60,140) ; 
etc. + 


Une chaîne de supermarchés annonce tous les jeudis des ventes à prix 
réduits. Le gérant de l'un de ces supermarchés décide un jour de mettre une 
annonce supplémentaire dans un journal local. Habituellement, ce gérant 
reçoit en moyenne 2 000 clients le jeudi; ce jeudi-là, il en reçoit 2 400. 
Peut-il conclure que son annonce dans le journal local a eu un effet ? La 
question est de savoir si cet écart de 400 est suffisamment grand pour être 
significatif, c'est-à-dire, pour être attribué à plus qu'un simple hasard. 
Supposons que l'écart-type du nombre de clients reçus le jeudi est s= 80. 
Alors le nombre 2 400 correspond à une cote Z de (2 400 — 2 000)/80 = 5. 
Cette cote Z importante porte à croire que l'annonce a bien eu l'effet voulu. 
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2.6 


Exemple 22 


TABLEAU 2.3 


MOYENNES PONDÉRÉES ET MOYENNES AJUSTÉES 


La moyenne d'une série de données est la somme des données divisée par le 
nombre de données. Cependant, lorsque les données sont elles-mêmes des 
moyennes, chaque donnée doit être pondérée, c'est-à-dire qu'elle doit être 
affectée d'un poids qui reflète son importance. 


Les gains hebdomadaires moyens, en dollars, pour les 10 provinces 
canadiennes, en 1985, étaient les suivants : 


405,89 306,74 381,99 401,98 449,89 455,32 408,06 438,20 496,72 504,43 


La moyenne de ces 10 nombres est 424,92 $. Mais est-ce la moyenne des 
gains hebdomadaires pour l'ensemble du Canada ? Non, parce que chacune 
des 10 moyennes est basée sur un nombre différent d'individus. La moyenne 
qui convient est une moyenne pondérée. Le tableau 2.3 donne les gains 
hebdomadaires ainsi que la distribution de la population active selon la 
province. 


Gains hebdomadaires pour les dix provinces canadiennes, 1985 


Prôvincè Gains Proportion de la 

(en dollars) population active 
Terre-Neuve 405,89 0,018 
Île-du-Prince-Édouard 306,74 0,005 
Nouvelle-Écosse 381,99 0,031 
Nouveau-Brunswick 401,98 0,024 
Québec 449,89 0,251 
Ontario 455,32 0,379 
Manitoba 408,06 0,041 
Saskatchewan 438,20 0,039 
Alberta 496,72 0,099 
Colombie-Britannique 504,43 0,113 
1,000 


SOURCE : Annuaire du Canada, 1986-1987 


La moyenne pondérée se calcule en prenant la somme des produits des 
moyennes par les fréquences. 
Moyenne = (405,89 x 0,018) + (306,74 x 0,005) +..+(504,43 x0,113) 

= 455,81 


Exemple 23 


TABLEAU 2.4 
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La moyenne pondérée n'est pas une nouvelle sorte de moyenne ; nous 
voulons uniquement attirer l'attention sur l'importance, dans le calcul d'une 
moyenne de moyennes, de prendre en compte le poids relatif de chacun des 
termes. La situation se complique lorsqu'on veut comparer les moyennes 
pondérées respectives de deux populations différemment réparties. Pour 
éviter dans ce cas les aberrations que peuvent produire les variations de 
fréquences, on choisit souvent d'utiliser une pondération commune. On parle 
alors de moyennes ajustées. 


Un échantillon de 1731 francophones bilingues et de 191 anglophones 
bilingues a été prélevé. Le tableau 2.4, adapté d'un texte de François 
Vaillancourt', donne leurs salaires annuels moyens, en dollars, pour l'année 
1970, selon la catégorie d'emploi. 


Salaires des francophones et anglophones, par catégorie d'occupation 


Francophones Anglophones 
. Salaire Salaire 
Occupation (en (en Effectif 

dollars) Effectif dollars) Effectif total 
Cadres et ingénieurs 10 243 261 13 505 41 302 
Santé / éducation 8 505 147 7 784 12 159 
Employés de bureau 5 924 272 5 841 35 307 
Vendeurs 7 498 218 8 882 32 250 
Employés de production 6 242 833 6 292 71 904 
TOTAL 1731 191 1 922 


Afin de comparer francophones et anglophones, nous calculons la moyenne 
de chaque groupe. Ensuite, pour pondérer, nous utilisons les effectifs 
échantillonnaux, supposant que ceux-ci sont à peu près proportionnels aux 
effectifs des populations respectives. Pour les francophones, la moyenne est : 


(10 243 x 261)+ (8 505 x 147) + (5 924 x 272) + (7 498 x 218) + (6 242 x 833) 
1731 


7 146 


Un calcul analogue pour les anglophones donne 8 285 $. Cette différence de 
1139 $ entre francophones et anglophones pourrait être l'effet de deux 
facteurs : 1) les francophones occupent des emplois moins payants ; 2) pour 
une même catégorie d'emploi, les francophones sont moins bien payés. Il est 
évident que le premier facteur joue un rôle important ici. On trouve, par 


* 
Département de sciences économiques et centre de recherche en développement économique, Cahier 7904, 
Université de Montréal, 1979 
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exemple, que 21 % des anglophones sont des cadres et ingénieurs alors que 
seulement 15 % des francophones le sont. D'autre part, 48 % des 
francophones sont des employés de production alors que seulement 37 % 
des anglophones le sont. Cela a pour effet de baisser la moyenne des 
francophones. Nous voudrions calculer deux moyennes de telle sorte que la 
différence entre francophones et anglophones ne puisse pas être attribuée à 
des effets comme ceux-ci. En d'autres termes, nous voudrions que la 
différence entre les deux ne soit pas affectée par des différences de 
pondération. 


La solution consiste à employer une même pondération pour les deux 
moyennes. Quelle pondération ? Trois choix s'offrent à nous : la pondération 
des francophones, la pondération des anglophones ou une pondération qui 
reflète la distribution de la catégorie d'emploi dans la population combinée 
des francophones et des anglophones. Ces méthodes sont toutes valables, 
mais nous considérons ici la dernière seulement. Nous supposons encore 
une fois que l'ensemble des deux échantillons représente bien la population 
des anglophones et francophones réunis. 


Utilisant la pondération donnée par les effectifs totaux, la moyenne ajustée 
pour les francophones est : 
(10 243 x 302) + (8 505 x 159) + (5 924 x 307 )+ (7 498 x 250) +(6 242 x 904) 

1922 


= 7170 


et la moyenne ajustée pour les anglophones est : 
(13 805 x 302) + (7 784 x 159) + (5 841x 807) + (8 882 x 250) + (6292x 904). 
1922 


814 


Remarquez que la différence s'amenuise : elle est de 644 $ au lieu de 
1 139 $. La différence de 1 139 $ est en partie due au fait que la distribution 
de la catégorie d'emploi n'est pas la même dans les deux populations, tandis 
que la différence de 644 $ ne peut être attribuée qu'au fait que, pour une 
catégorie d'emploi donnée, les francophones sont en moyenne moins bien 
payés. + 
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RÉSUMÉ 


Soit x, x, .…,x, une série de données. La moyenne arithmétique est 


2 
définie par : 


Ex, 


X = — 


n 


Le mode est la valeur ayant la plus grande fréquence. Supposons que les 
données sont rangées en ordre croissant ou décroissant. La médiane est 
la donnée centrale, lorsque n est impair; elle est la moyenne 
arithmétique des deux données centrales lorsque n est pair. Au moins 
une moitié des données est inférieure ou égale à la médiane ; et au moins 
une moitié est supérieure ou égale à la médiane. 


Le quantile d'ordre à est soit la donnée dont le rang est l'entier le plus 


1 
près de an+— ; soit, si an est entier, la moyenne des données de rangs 
2 


respectifs est an et an + 1. 


En prenant pour « des multiples de 1/4, on obtient les quartiles ; en 
prenant des multiples de 1/10 on obtient les déciles ; en prenant des 
multiples de 1/100 on obtient les centiles. 


La variance s° se définit par l'une ou l'autre des formules équivalentes 
suivantes : 


je. Z(x, -x)° L Lx? -nx° L Da —(Zx,) /n 


n n n 


S 


L'écart-type s est la racine carrée de s°. 
L'écart interquartile E est la différence des 3° et 1er quartiles : 
E=OQ-0Q: 


Soit x,, x, .…,x, les valeurs distinctes d'une variable, n,, n, 


effectifs correspondants et f, f,, .…., f, les fréquences correspondantes. 
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Soit n = Zn, l'effectif total. Le mode est la valeur x à laquelle correspond la 
fréquence f, la plus grande. On peut repérer la médiane en imaginant les n 


données écrites au long. 


La moyenne arithmétique se calcule par l'une ou l'autre des formules 
suivantes : 


La variance est calculée par l'une ou l'autre des formules suivantes : 
= x.9 2. 2 
, ZG,-x) n, 2x -(2x,n,) /n Ti 
= = = X X . 


n n 


S 


Les mêmes formules s'appliquent aux données groupées en prenant pour 
x, le point milieu de la ième classe. Les résultats, cependant, sont 


approximatifs. 
3. Soit X une variable de moyenne x et de variance se Soit Y=a+bX où a 
et b sont des constantes. Alors la moyenne y, la variance ie et 


l'écart-type s, de Y sont donnés par : 


= =) omis 
y=a+bx s,=b's, s, =|b|s, 


4. Soit X une variable de moyenne x et d'écart-type s,. La nouvelle 


variable 


est centrée réduite, car de moyenne nulle et de variance 1. On l'appelle 
souvent cote Z. Soit p la proportion des membres d'une population dont 
la cote Zest soit supérieure ou égale à k, soit inférieure ou égale à -k, où 
k est un nombre supérieur à 1. Alors p n'est jamais supérieure à 1/ k° 


5. Une définition générale de x est x=Yx,f, où les f, représentent des 


« poids » qui reflètent l'importance relative de chaque valeur et dont la 
somme vaut 1. Ces poids sont souvent les fréquences d'une distribution, 
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mais lorsque les x, sont des moyennes de sous-populations, les f sont 


alors proportionnels aux tailles des sous-populations. Dans ce cas, x est 
dite moyenne pondérée des x. Parfois, les moyennes de deux 


populations ou plus sont calculées avec une pondération commune, 
habituellement celle qui s'appliquerait à la réunion de ces populations. 
Ces moyennes sont appelées moyennes ajustées. 


EXERCICES 
le 


MESURES DE 
TENDANCE 
CENTRALE 


VARIANCE, 
ÉCART-TYPE ET 
ÉCART 
INTERQUARTILE 


5. 


Calculez la moyenne arithmétique et la médiane des données 
suivantes. Déterminez aussi le mode, s'il existe. 


4 223334444445 567 8 

b) 7,1 8,2 9,4 11,2 14,5 18,3 12,5 

c) 2,8 2,7 3,9 4,7 2,8 1,9 7,8 8,4 

Déterminez la médiane et le mode de chacune des séries suivantes : 
a) 20 21 22 23 24 

b) 20 21 22 23 38 

c) 5 21 22 23 24 

Déterminez les trois quartiles de chacune des séries suivantes : 
ad 011123333479 99 12 

b) 100824106646 

co 22222 2 2 8 10 12 20 30 40 


Déterminez la moyenne arithmétique, la médiane et les quartiles des 
séries suivantes : 


a) 1 2 3 4 … 31 


b) -20 -19 -18 …… -1 O 1 2 … 20 


Calculez la variance et l'écart-type de chacune des séries données aux 
numéros 1 et 2. 


Laquelle des deux séries suivantes vous semble la plus dispersée ? 
Confirmez votre réponse en calculant l'écart-type de chacune. 

A : 40 49 50 51 60 

B : 48 49 50 51 52 
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7. 


8. 


10. 


11. 


12. 


Laquelle des deux séries suivantes vous semble la plus dispersée ? 
Confirmez votre réponse en calculant l'écart-type de chacune. 


À : 40 50 60 70 80 
B : 40 59 60 61 80 


La série B ci-dessous est obtenue en ajoutant 10 à chaque membre de la 
série A. Intuitivement, comment se comparent les deux écarts-types ? 
Confirmez votre intuition en calculant les deux écarts-types. 


A:0510 15 20 
B : 10 15 20 25 30 


La série B ci-dessous est obtenue en multipliant par 5 chaque membre 
de la série A. Intuitivement, comment se comparent les deux 
écarts-types ? Confirmez votre intuition en calculant les deux 
écarts-types. 


A:0510 15 20 
B : 0 25 50 75 100 


Calculez la variance de la série suivante en employant les trois formules 
données dans la section 2.2. 


581216 19 


Calculez l'écart interquartile de chacune des séries données aux numéros 
3 et 4. 


Comparez les diverses mesures de tendance centrale et de dispersion que 
l'on peut utiliser pour décrire la série suivante de notes (sur 10) à un 
examen de statistique. 


77010488847780448888 


MESURES 
D'UNE 


DISTRIBUTION 


15. 


14. 


15 
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Les données suivantes représentent les revenus moyens des ménages 
dans 100 subdivisions de recensement. Construisez une moustache pour 
les représenter. Quelles sortes de quartiers seront au-delà des limites ? 


13441 16870 18269 19366 20364 21295 22196 23504 26248 30214 
13489 17186 18365 19498 20495 21410 22323 23548 26385 32720 
13893 17353 18540 19533 20754 21440 22350 23580 26713 33 532 
14052 17428 18542 19725 20798 21580 22361 23598 26736 33 750 
15383 17465 18555 19806 20799 21597 22436 24130 26789 34406 
16333 17617 18712 19974 20877 21722 22496 24299 27651 35136 
16347 17648 18905 20139 20883 21787 22533 24423 28002 38275 
16370 17825 18966 20230 21160 21888 22681 24476 28041 39307 
16480 17875 18982 20271 21232 21909 22845 25002 28698 44853 
16510 18151 19182 20306 21240 22137 22914 25364 28881 49754 


SOURCE : Statistique Canada 


Les données suivantes représentent les revenus nets, exprimés en 
pourcentage des ventes, de 74 compagnies. Tracez une moustache pour 
les représenter. 


0,1 2,6 3,5 4,1 4,7 5,6 7,7 9,4 
0,7 2,8 3,5 4,2 4,8 5,7 7,8 15,2 
0,8 2,9 3,6 4,3 4,8 6,5 7,9 18,5 
1,0 3,0 3,7 4,3 4,8 6,7 7,9 25,3 
1,4 3,1 3,7 4,4 4,9 6,9 8,0 
1,8 3,2 3,8 4,4 4,9 6,9 8,1 
2,0 3,3 3,8 4,5 5,2 7,4 8,2 
2,0 3,4 3,8 4,6 5,3 7,6 8,2 
2,3 3,4 3,9 4,6 5,5 7,7 8,4 
2,4 3,5 4,1 4,7 5,5 7,7 8,8 


Déterminez la moyenne arithmétique, la médiane, le mode, la variance et 
l'écart-type de la distribution suivante : 


Valeur 0 5 7 8 TOTAL 


Effectif 1 3 4 2 10 


Employez les formules de la section 2.3, puis recommencez les calculs en 
appliquant les formules de la section 2.2 à la série : 


0555777788 


Examinez de près les deux séries de calculs pour constater que les deux 
méthodes reviennent au même. 
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16. Laquelle des deux variables suivantes vous semble la plus dispersée ? 
Justifiez votre réponse à l'aide de graphiques et des deux écarts-types : 


Variable X 

x 1 2 3 4 5 TOTAL 
Effectif 3 1 2 1 3 10 
Variable Y 

y 1 2 3 4 5 TOTAL 
Effectif 1 2 4 2 1 10 


17. Déterminez la moyenne arithmétique, le mode, la médiane, la variance et 
l'écart-type de la distribution suivante : 
Valeur 1 2 3 4 5 TOTAL 
Fréquence 0,1 0,4 0,2 0,2 0, 1 


18. Déterminez l'écart interquartile de chacune des distributions suivantes. 


a) x 1 2 5 6 8 9 TOTAL 
Effectif 3 3 9 6 5 11 37 
b) x O<x<4 A<x<8 8<x<16 16<x<20 
Fréquence 0,12 0,37 0,19 0,32 
oMAuORS 19 Soit x) %. x: 44 12.14 Série Shivarite : 
LINÉAIRES 


571113 15 


Construisez une nouvelle série y,, y,, y,, y,, y,, en multipliant chaque 


terme de la première série par 2 puis en ajoutant 10 au produit. 
Énumérez les éléments de cette deuxième série. Calculez la moyenne x 


: 2 GS Le N 5 _ 

et la variance s, de la première série, ainsi que la moyenne y et la 
. 2 :& Fes Dante = Ts 

variance s, de la deuxième série. Vérifiez que y=2x+10 et que 


2 2 
s, = 4s;. 


COTE Z 


MOYENNES 
PONDÉRÉES 
OU AJUSTÉES 


20. 


21. 


22. 


23. 


24. 


25. 
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Calculez la moyenne et l'écart-type de la série : 
257912 


Employez la moyenne et l'écart-type obtenus pour calculer la moyenne et 
l'écart-type de la série : 


2012 2030 2042 2054 2 072 


La moyenne et la variance d'une série de températures quotidiennes, en 
degrés Celsius, sont respectivement 18 et 25. Déterminez la moyenne et 
la variance de la même série, exprimée en degrés Fahrenheit 


CF = 32 + 2°). 


Votre note est de 68 dans une classe où la moyenne est de 54 et 
l'écart-type est de 14. Quelle est votre cote Z ? 


Calculez la cote Z de chaque membre de la série 5 7 8 9 11, puis calculez 
la moyenne et la variance des 5 cotes Z. 


Un médecin vous dit que votre pression intra-oculaire est de 23. Pour 
une population de 100 000 personnes de votre âge, la pression moyenne 
est de 17 avec un écart-type de 2,5. Combien, au maximum, y a-t-il de 
personnes dans la population qui ont une pression au moins aussi 
éloignée de la moyenne que la vôtre ? 


Deux cent cinquante étudiants répartis en six groupes ont suivi un cours 
de statistique. Le nombre d'étudiants et la note moyenne de chaque 
groupe sont indiqués dans le tableau suivant : 


Groupe Nombre d'étudiants Moyenne du groupe 
1 47 63 
2 38 61 
3 30 68 
4 55 54 
5 40 72 
6 40 73 


Calculez la moyenne des 250 étudiants. 
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26. 


27. 


28. 


Le propriétaire de deux concessions de vente d'automobiles analyse le 
rendement de ses deux concessions. La concession X a vendu 313 
voitures à un prix moyen de 16 262 $ ; la concession YŸ a vendu 295 
voitures à un prix moyen de 13 831 $. Avant de reprocher au gérant de 
la concession Ÿ de vendre les voitures à un prix trop bas, le propriétaire 
examine le détail des ventes par catégories de voitures. Le 
concessionnaire X a vendu 43 voitures de catégorie À, 50 de catégorie B, 
70 de catégorie C et 150 de catégorie D. Le concessionnaire YŸ a vendu 10 
voitures de catégorie À, 20 de catégorie B, 65 de catégorie C et 200 de 
catégorie D. Le prix moyen, en milliers de dollars, pour chaque 
concessionnaire et pour chaque catégorie de voitures est donnée par le 
tableau suivant : 


Prix moyen par catégorie de voitures (en milliers de dollars) 


A B C D 
X 30 22 15 11 
Y 31 23 14 12 


Calculez une moyenne pour chaque concessionnaire de façon que la 
différence entre les deux moyennes ne soit pas affectée par la différence 
dans les distributions des catégories de voitures. 

Soit X le revenu annuel des corporations multinationales dont le siège 
social est situé au Canada ; et soit Y le revenu annuel des petites et 
moyennes entreprises du Canada. D'après vous, l'écart-type de X est-il 
supérieur ou inférieur à celui de Y ? Discutez. 

Calculez l'écart-type des températures en janvier et l'écart-type des 
températures en juillet à Montréal à partir des données suivantes : 


Températures moyennes à Montréal - janvier et juillet, 1965-1976 (en °Celsius) 


Année Janvier Juillet 
1965 —10,0 20,0 
1966 —9,4 21,7 
1967 —5,6 22,2 
1968 —12,2 22,2 
1969 —7,2 21,7 
1970 —13,3 23,3 
1971 —11,1 21,7 
1972 —6,7 21,7 
1973 —6,1 21,7 
1974 —9,8 23,3 
1975 —6,3 21,0 
1976 —11,9 23,9 


SOURCE : Annuaire du Québec, 1971, 1980 


29. 


30. 


31. 


32. 
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Voici la distribution du nombre de familles par logement pour la région 
métropolitaine de Montréal en 1981 : 


Nombre de familles Effectif 
0 293 390 

1 724 975 

2 et plus 8 560 
TOTAL 1 026 925 


SOURCE : Recensement du Canada, 1981 
a) Quel est le mode de cette variable ? 
b) Quelle est la médiane ? 


Dites lesquelles des propositions suivantes sont vraies. Pour celles qui ne 
sont pas vraies, trouvez un contre-exemple. 


a) 50 % des données sont inférieures à la médiane et 50 % sont 
supérieures à la médiane. 


b) 50 % des données sont inférieures ou égales à la médiane. 

c) Au plus 50 % des données sont inférieures ou égales à la médiane. 
d) Au moins 50 % des données sont inférieures ou égales à la médiane. 
e) Au plus 50 % des données sont inférieures à la médiane. 


Voici les distributions du nombre de personnes par ménage, pour la 
région métropolitaine de Montréal et pour la ville de Montréal : 


Effectif 
Nombre de personnes 
Région métropolitaine Ville de Montréal 
1 120 370 84 100 
2 201 110 109 905 
3 148 510 70 735 
4et5 240 630 93 975 
de6à9 91 035 34 265 
10 ou plus 4 370 1 746 
TOTAL 806 025 394 726 


SOURCE : Recensement du Canada, 1971 

a) Calculez la médiane et le mode pour la ville de Montréal. 

b) Est-il possible d'en faire autant pour la région métropolitaine ? 

Soit À la série des 365 températures quotidiennes à Montréal en 1981 et 


B la série des 365 températures quotidiennes à Miami en 1981. D'après 
vous, laquelle des deux séries a une plus grande variance ? 
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33. 


34. 


35. 


36. 


37. 


Deux supermarchés, À et B, reçoivent en moyenne le même nombre de 
clients par jour. Cependant, l'écart-type est beaucoup plus élevé au 
supermarché A. D'après vous, lequel des deux supermarchés aura des 
dépenses en personnel plus élevées ? 


Dans une région du globe un peu aride, on enregistre la précipitation 
quotidienne pendant 60 jours consécutifs. La moyenne des 60 données 
est égale à 0. Que vaut l'écart-type ? 


Un test de dextérité manuelle donne un score moyen de 60 pour la 
population. Un score de 65 est donc supérieur à la moyenne. Dans lequel 
des deux cas suivants un score de 65 est-il plus spectaculaire ? 


a) L'écart-type de la population est égal à 1. 
b) L'écart-type de la population est égal à 20. 


Le tableau suivant donne la répétition des revenus en 1984 des familles 
canadiennes ayant un revenu inférieur à 60 000 $. 


Revenu Fréquence 
<5000$ 0,017 
5 000 - 9 999 0,063 
10 000 - 11 999 0,037 
12 000 - 14 999 0,072 
15 000 - 16 999 0,047 
17 000 - 19 999 0,062 
20 000 - 21 999 0,040 
22 000 - 24 999 0,062 
25 000 - 26 999 0,047 
27 000 - 29 999 0,067 
30 000 - 31 999 0,045 
32 000 - 34 999 0,069 
35 000 - 36 999 0,045 
37 000 - 39 999 0,062 
40 000 - 44 999 0,092 
45 000 - 49 999 0,072 
50 000 - 59 999 0,101 


SOURCE : Statistique Canada 


Estimez la moyenne et la médiane de ces revenus, ainsi que l'écart-type, 
les quartiles et l'écart interquartile. 


Considérons les variables X et Y, où X représente la proportion 
quotidienne de garçons parmi les nouveaux-nés d'un petit hôpital et Y la 
proportion quotidienne parmi tous les nouveaux-nés canadiens. D'après 
vous, laquelle des deux variables a le plus grand écart-type ? Discutez. 


38. 


39. 


40. 


41. 


42. 


43. 
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La variance d'une variable dépend-elle de l'unité de mesure ? Considérez, 
par exemple, les tailles d'une population. La variance change-t-elle selon 
que les tailles sont exprimées en pouces ou en centimètres ? La cote Z 
d'une personne change-t-elle selon que les tailles sont exprimées en 
pouces ou en centimètres ? 


Deux étudiants terminent un cours de comptabilité. L'étudiant À, qui a 
suivi le cours avec le chargé de cours X a obtenu la note 69 à l'examen 
final ; l'étudiant B, avec le chargé de cours Ÿ, a obtenu la note 75. Pour 
la classe de X, la moyenne est de 60 et l'écart-type de 3 ; pour Ÿ la 
moyenne est également de 60, et l'écart-type de 10. Lequel des deux 
étudiants a eu le meilleur résultat ? 


Dans un cours, il y a deux examens de même importance : un intra et un 
final. La note moyenne de la classe est de 60 pour les deux examens, 
mais l'écart-type est de 10 à l'intra et de 20 au final. Un étudiant a eu 60 
à l'intra et 80 au final ; un autre a eu 80 à l'intra et 60 au final. Lequel 
est le meilleur ? Discutez. 


Un marchand se plaint à la ville du fait que certains travaux effectués 
par la municipalité ont causé une diminution de la circulation sur la rue 
du marchand et donc une baisse dans ses recettes. Pour appuyer sa 
plainte, il signale que ses recettes sont en moyenne de 20 000 $ par jour, 
et que le jour des travaux elles n'étaient que de 19 500 $. La ville 
réplique qu'un écart de 500 $, pour des recettes moyennes de 20 000 $, 
est trop petit et donc ne démontre rien. Le marchand calcule alors 
l'écart-type de ses recettes quotidiennes. Il trouve s = 100 $. Qui a 
raison ? 


Une succursale de banque reçoit constamment les dépôts sous la forme 
de rouleaux de 40 pièces de 25 €. Pour s'assurer que ces rouleaux 
contiennent bien 40 pièces, le gérant conçoit l'idée de mesurer les 
longueurs des rouleaux déposés et de rejeter ceux qui seraient trop longs 
ou trop courts. Pour fixer des critères, il mesure plusieurs centaines de 
rouleaux de 40 pièces. Il trouve que leurs longueurs ont une moyenne de 
65 mm avec un écart-type de 0,99 mm. Dès lors, il décide de rejeter tout 
rouleau de moins de 62,03 cm et de plus de 67,97 mm. Quel est, au 
maximum, le pourcentage des rouleaux contenant réellement 40 pièces 
qu'il rejettera ? 


Un vérificateur doit faire une estimation du montant total des comptes à 
payer. Il y a en tout 10 570 comptes, répartis en 3 « strates », selon 
l'importance du compte : il y a 70 comptes dans la strate 1, 500 comptes 
dans la strate 2 et 10 000 comptes dans la strate 3. Pour estimer le 
montant total il procède par échantillonnage. Dans la strate 1, il choisit 
au hasard 20 comptes. Il trouve que le montant moyen par compte est de 
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44. 


45. 


3 010,75 $. De la strate 2, il tire 200 comptes et trouve une moyenne de 
580,60 $. De la strate 3, il tire 300 comptes et trouve une moyenne de 
89,78 $. Supposez que ces moyennes échantillonnales sont de bonnes 
estimations des vraies moyennes des strates. Estimez alors le montant 
total des comptes à payer. 


Un taux de mortalité est essentiellement une moyenne : il représente le 
nombre de décès par 1 000 habitants en une année donnée. Le tableau 
suivant donne le taux de mortalité pour des hommes et des femmes de 5 
ans et plus en 1971, par groupe d'âge. Il donne également la distribution 
de l'âge des Canadiens de 5 ans et plus. 


a) Calculez le taux de mortalité pour les hommes et pour les femmes en 
pondérant selon les fréquences ci-dessus. 


b) Lorsqu'on calcule le taux de mortalité des hommes en utilisant la 
distribution de l'âge des hommes (qui n'est pas donnée ici), on obtient 
le taux de 8,5 ; un calcul analogue pour les femmes donne un taux 
de 6,1. Interprétez les différences que vous trouvez entre ces taux et 
ceux que vous avez calculés en a). 


: Taux 
Age Fréquence 
Hommes Femmes 

5-9 0,6 0,4 0,114 
10 - 14 0,5 0,3 0,117 
15 - 19 1,4 0,6 0,107 
20 - 24 1,8 0,6 0,096 
25 - 29 1,5 0,6 0,080 
30 - 34 1,6 0,9 0,067 
35 - 39 2,2 1,3 0,064 
40 - 44 3,6 2,1 0,064 
45 - 49 5,7 3,0 0,062 
50 - 54 9,3 4,6 0,053 
55 - 59 14,6 7,2 0,048 
60 - 64 22,9 11,0 0,039 
65 - 69 34,7 17,3 0,032 
70 - 74 51,9 28,3 0,023 
75-79 79,0 48,1 0,016 
80 - 84 118,8 82,4 0,010 

85 + 198,5 163,3 0,008 


1,000 


SOURCE : Recensement du Canada, 1971 


Le tableau suivant donne, pour les hommes et pour les femmes, le 
revenu annuel moyen en dollars pour l'année 1971, selon le nombre de 
semaines de travail. Il s'agit des personnes de 15 ans et plus ayant 
travaillé à plein temps. Les effectifs sont en milliers. 


a) Calculez le revenu moyen des hommes et le revenu moyen des 
femmes. 
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b) Calculez, pour les hommes et pour les femmes, les moyennes 
ajustées pour le nombre de semaines de travail. 


Hommes Femmes 
Nombre de 

semaines | Revenu : Revenu 
EREQUE (en dollars) EneCU (en dollars) 

1-13 274,5 1 591 234,0 845 

14 - 26 352,3 2 973 258,7 1 889 

27 - 39 442,4 4 788 236,3 3 026 

40 - 48 736,0 7 162 323,2 4 026 

49 - 52 3 541,1 8 230 1 276,5 4 932 


SOURCE : Annuaire du Canada 1976-1977 


46. Le tableau suivant donne le montant de l'impôt fédéral payé en 1974 et 
en 1973 par les contribuables dont le revenu a été d'au moins 2 000 $. 


Catégorie de Nombre de contribuables Impôt fédéral payé 
revenu (X) (en milliers) (en millions de dollars) 
(en milliers de 
ele 1973 1974 1973 1974 
2<X<3 571,0 427,8 13,8 1,2 
3<X<5 1 702,6 1 381,7 322,3 158,2 
5<X<7 1 662,0 1 594,4 777,6 594,4 
7<X<10 1 975,3 1 985,8 1 721,0 1 519,4 
10<X< 15 1 669,0 2 155,2 2 582,2 3 089,6 
15<X<25 599,9 1 037,7 1 713,0 2 796,9 
25<X < 50 142,9 224,5 937,9 1 384,2 
50 < X 34,9 50,0 765,0 1 071,3 


SOURCE : Annuaire du Canada, 1976-1977 


a) Comparez, pour chaque tranche de revenu, l'impôt moyen payé par 
les contribuables en 1973 et en 1974. 


b) Comparez, pour l'ensemble de tous les contribuables (de revenu 
supérieur à 2 000 $), l'impôt moyen payé en 1973 et en 1974. 
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Introduction Certaines études statistiques, conçues à des fins très précises, 
se concentrent sur un seul caractère des unités observées. Lorsqu'on fait des 
prélèvements réguliers pour contrôler la qualité d'une production, on 
s'intéresse généralement à un seul indice de qualité. Cela peut être une 
variable qualitative qui identifie un article comme étant acceptable ou non ; 
ou une variable quantitative mesurant une caractéristique de l'article, 
comme le poids net du contenu, pour une boîte de conserve ; ou la force de 
rupture, pour un matériau ; ou la concentration de matières grasses, pour 
un morceau de fromage. 


Beaucoup d'autres études, cependant, ont un objectif plus large ou plus 
vague ; elles accumulent alors des données sur plusieurs variables. Un ques- 
tionnaire rempli par un certain nombre de répondants, par exemple, 
engendre autant de variables qu'il contient de questions. Dans ces cas-là, 
l'intérêt peut porter non seulement sur chacune des questions comme telle, 
mais également - on peut même dire surtout — sur les liens qui peuvent exis- 
ter entre les variables. En fait, certaines études ont pour unique but d'établir 
l'existence d'un lien entre certaines variables. L'épidémiologue qui prélève des 
données sur la consommation de cigarettes et l'état des poumons ne cherche 
pas à savoir quelle est la consommation de cigarettes de la population, ni 
quel est l'état des poumons de cette population. Il cherche à savoir s'il y a un 
lien entre la consommation de cigarettes et l'état des poumons. L'information 
qu'il possède sur ces deux variables doit donc être présentée de façon à faire 
ressortir ce lien. 


3.1 


DISTRIBUTION CONJOINTE 


Soit X et Y deux variables qualitatives définies sur une même population. On 
peut présenter la distribution de chacune à l'aide des moyens décrits dans le 
chapitre 1. L'information contenue dans ces deux distributions distinctes se 
révèle toutefois insuffisante si l'objectif consiste à étudier la relation entre les 
variables. Pour cela, l'information essentielle prend la forme d'une 
distribution conjointe. 


Le tableau 3.1 présente la distribution conjointe de deux variables définies 
pour l'ensemble des bébés au Québec en 1983 ; les variables sont : 


X : sexe (garçon, fille) 


Ÿ : poids à la naissance (faible, moyen, élevé, très élevé) 
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TABLEAU 3.1 


TABLEAU 3.2 


Nous avons déjà examiné séparément les distributions des poids pour les 
filles et pour les garçons, et les avons même comparées en utilisant les poly- 
gones de fréquences (voir fig. 1.6, page 13). Ici, nous les étudions conjointe- 
ment, en tant que variables qualitatives. Tout comme la distribution d'une 
seule variable, la distribution conjointe de deux variables fait correspondre 
un effectif à une « valeur », sauf qu'ici la « valeur » est en fait un couple : une 
valeur de X et une valeur de Y. Par exemple, au couple (fille, élevé), la distri- 
bution du tableau 3.1 fait correspondre l'effectif 27 566, ce qui veut dire qu'il 
y a eu en 1983 au Québec 27 566 bébés qui étaient des filles et qui avaient 
un poids élevé à la naïssance. 


Sexe (X) et poids à la naissance (Y) des bébés québécois - 1983 


Y : poids à la naissance 


X : Sexe Faible Moyen Élevé Très élevé TOTAL 
(0,5-2 kg) (2-3 kg) (3-4 kg) (4+ kg) 

Garçons 830 8 615 30 784 4 839 45 068 

Filles 862 11 183 27 566 2 348 41 959 

TOTAL 1 692 19 798 58 350 7 187 87 027 


SOURCE : Bureau de la statistique du Québec 


Sexe (X) et poids des bébés (Y) - Québec 1983 


X : Sexe Y : poids à la naissance 


TOTAL 
Faible Moyen Élevé Très élevé 
Garçons 0,009 0,099 0,354 0,056 0,518 
Filles 0,010 0,128 0,317 0,027 0,482 
TOTAL 0,019 0,227 0,671 0,083 1,000 


SOURCE : Tableau 3.1 


Une distribution conjointe peut également s'exprimer en fréquences : il suffit 
de diviser chaque effectif par l'effectif total. Le tableau 3.2 exprime, en 
fréquences, la distribution du tableau 3.1. 


3.2 


DISTRIBUTION MARGINALE 


Le tableau 3.1 (ou 3.2) contient bien plus d'information que ne 
contiendraient deux tableaux donnant l'un la distribution de X, l'autre celle 
de Y. Du reste, ces deux distributions, appelées distributions marginales 
dans ce contexte, se retrouvent intégralement dans les marges du tableau 


3 Distributions à deux variables qualitatives 81 


3.1 (ou 3.2). Les effectifs (fréquences) de la distribution de X sont les sommes 
des lignes du tableau 3.1 (ou 3.2). Les effectifs (fréquences) de la distribution 
de Y sont les sommes des colonnes du tableau 3.1 (ou 3.2). Ainsi, la 
distribution marginale de Y est (voir tableau 3.2) : 


Y Faible Moyen Élevé Très élevé TOTAL 
Fréquence 0,019 0,227 0,671 0,083 1,000 


Cette distribution est simplement la distribution de Y. Il n'y a pas de 
différence entre « distribution de Y » et « distribution marginale de Y ». 
L'adjectif « marginale » est employé dans ce contexte pour distinguer la dis- 
tribution marginale de la distribution conditionnelle, que nous introduisons 
maintenant. 


3.3 


DISTRIBUTION CONDITIONNELLE 


La distribution conjointe de deux variables X et Y contient toute l'information 
nécessaire à l'étude de la relation entre les variables. Mais elle ne met pas 
cette relation clairement en évidence. La notion de relation ou de 
dépendance entre deux variables s'exprime en termes de distributions 
conditionnelles. Une distribution conditionnelle de Y est la distribution de Y 
confinée à une tranche de la population, cette tranche étant définie par une 
valeur de X. Par exemple, la distribution conditionnelle de Y étant donné X = 
« garçon » est la distribution de Y limitée à l'ensemble des garçons. D'après le 
tableau 3.1, la distribution de Y pour cette sous-population (les garçons) est 
la suivante : 


Y Faible Moyen Élevé Très élevé TOTAL 


Effectif 830 8 615 30 784 4 839 45 068 


L'analyse qui suit réclame que l'on exprime cette distribution en fréquences. 
Lorsqu'on divise chaque effectif par l'effectif total, on obtient la distribution 
suivante : 


Distribution conditionnelle de Y étant donné X = « garçon » 


Y Faible Moyen Élevé Très élevé TOTAL 


Fréquence 0,019 0,191 0,683 0,107 1 000 
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TABLEAU 3.3 


TABLEAU 3.4 


On peut déterminer de la même façon la distribution conditionnelle de Y 
étant donné X = «fille». Afin d'étudier la dépendance entre les deux variables, 
on juxtapose les distributions conditionnelles de YŸ étant donné chacune des 
valeurs de X. Le tableau 3.3 donne les deux distributions conditionnelles 
(ainsi que la distribution marginale). 


Distributions conditionnelles des poids à la naissance (Y) étant donné le sexe (X) 
(en fréquences) 


Y : poids à la naissance 


X : sexe - TOTAL 
Faible Moyen Élevé Très élevé 

Garçons 0,019 0,191 0,683 0,107 1,000 

Filles 0,021 0,266 0,657 0,056 1,000 

Toutes naissances 0,019 0,227 0,671 0,083 1,000 


Distributions conditionnelles du sexe (X) étant donné le poids (Y) à la naissance (en fréquences) 


X:sexe 
Y : poids à la naissance TOTAL 
Garçon Fille 
Faible 0,491 0,509 1,000 
Moyen 0,435 0,565 1,000 
Élevé 0,528 0,472 1,000 
Très élevé 0,673 0,327 1,000 
Toutes naissances 0,518 0,482 1,000 


Le tableau 3.3 permet de donner un sens précis à la proposition « le poids 
des bébés à la naissance dépend de leur sexe ». Cette proposition signifie, en 
gros, que le poids n'est pas le même chez les garçons et chez les filles. Plus 
précisément, les distributions conditionnelles ne sont pas identiques. Le 
tableau 3.3 met cette observation en évidence, et cela nous fait dire que le 
poids dépend du sexe : la distribution conditionnelle de Y change selon que 
X = « garçon » ou X = « fille ». 


Une fois établi qu'il y a dépendance, on s'interroge alors sur la nature de 
cette dépendance. On peut dire alors qu'il y a presque la même fréquence de 
très petits bébés, il y a sensiblement plus de filles de poids moyen et 
sensiblement plus de garçons de poids élevé. 


Nous avons jusqu'ici fait jouer des rôles apparemment différents à nos deux 
variables. En réalité, il n'existe aucune raison mathématique pour 
« préférer» une variable à une autre. Du point de vue technique, une 
information aussi valable est donnée par les distributions conditionnelles de 
X par rapport aux valeurs de Y. Ces distributions (de même que la 
distribution marginale) sont présentées au tableau 3.4. 
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De même que le tableau 3.3 indique que Ÿ dépend de X, le tableau 3.4 
indique que X dépend de Y ; en effet, les distributions conditionnelles de X 
étant donné chaque valeur de Y sont différentes. Mathématiquement, les 
deux propositions (« Y dépend de X », « X dépend de Y ») sont aussi vraies (ou 
fausses) l'une que l'autre, et toujours simultanément vraies (ou fausses). 


Intuitivement, une de ces propositions est, le plus souvent, plus naturelle 
que l'autre car on attribue spontanément à une des deux variables un rôle 
de cause, à l'autre un rôle d'effet. Dans le cas présent, puisque, s'il y a 
dépendance, c'est le poids qui dépend du sexe et non l'inverse, on préfère 
présenter les distributions conditionnelles du poids de chaque sexe. 


3.4 


INDÉPENDANCE 


En général, lorsque les distributions conditionnelles de Y étant donné les 
valeurs de X ou les distributions conditionnelles de X étant donné les valeurs 
de Y sont différentes, on dit que Ÿ dépend de X (ou que X dépend de Y, le 
choix entre ces deux affirmations dépendant du contexte intuitif]. Dans le 
cas contraire, c'est-à-dire quand les distributions conditionnelles de Y (ou 
celles de X) sont identiques, on dit que les deux variables X et Y sont 
indépendantes. L'indépendance peut se caractériser de plusieurs façons ; 
nous en donnons ici les plus utilisées. 


a) SiXet Ÿ sont indépendantes, alors les distributions conditionnelles de Y 
(exprimées en fréquences) sont identiques entre elles, quelle que soit la 
valeur de X, et sont alors nécessairement identiques à la distribution 
marginale de Y. 


b) SiXet Y sont indépendantes, alors les distributions conditionnelles de X 
(exprimées en fréquences) sont identiques entre elles, quelle que soit la 
valeur de YŸ, et sont alors nécessairement identiques à la distribution 
marginale de X. 


c) Si X et Y sont indépendantes, alors, dans le tableau donnant leur 
distribution conjointe, l'effectif de chaque case est en fonction des totaux 
de la ligne et de la colonne dans lesquelles se trouve la case. L'effectif de 
la case située à l'intersection de la ligne 1 et de la colonne jest égal à : 


(total de la ligne à x (total de la colonne j) + (effectif total). 


d) Si X et Ÿ sont indépendantes, alors, pour chaque case du tableau, la 
fréquence de cette case est égale au produit des fréquences marginales 
de la ligne et de la colonne qui se rencontrent à cette case. 
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Exemple 1 


Considérons les deux variables : 
X : langue maternelle 
Y : quotient intellectuel. 


Supposons que la distribution conjointe de ces deux variables (obtenue d'un 
échantillon de 120 étudiants) est la suivante : 


X : langue maternelle Y : quotient intellectuel TOTAL 
Inférieur à 100 Supérieur ou égal à 100 
Français 18 22 40 
Anglais 27 33 60 
Autres 9 11 20 
TOTAL 54 66 120 


Les distributions conditionnelles de Y sont : 


X : langue maternelle Y : quotient intellectuel TOTAL 
Inférieur à 100 Supérieur ou égal à 100 
Français 0,45 0,55 1,00 
Anglais 0,45 0,55 1,00 
Autres 0,45 0,55 1,00 
TOTAL 0,45 0,55 1,00 


Puisque les distributions conditionnelles sont égales, nous concluons que les 
variables sont indépendantes : le quotient intellectuel ne dépend pas de la 
langue maternelle. Remarquez que les distributions conditionnelles sont non 
seulement identiques l'une à l'autre, mais aussi à la distribution marginale. 
On observe le même phénomène dans les distributions conditionnelles de X 
étant donné Y : 


X : langue maternelle Y : quotient intellectuel 
Inférieur à 100 Supérieur ou égal à 100 
Français 1/3 1/3 1/3 
Anglais 1/2 1/2 1/2 
Autres 1/6 1/6 1/6 
TOTAL 1 1 1 


Finalement, remarquez que l'effectif « 18 » de la case située à la première 
ligne, première colonne est égal à 40 x 54 + 120 (c'est-à-dire, au produit du 
total de la première ligne par le total de la première colonne, divisé par 
l'effectif total). Le lecteur peut vérifier cette propriété pour les autres cases. + 
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Remarque Les données de l'exemple 1 sont fictives, et pour une bonne raison. 
En pratique, des données comme celles-ci, avec des distributions 
conditionnelles tout à fait identiques, ne se produisent jamais. La définition 
d'indépendance donnée ici représente une situation idéalisée qui ne se reflète 
pratiquement jamais dans des données réelles. En pratique, on ne devrait pas 
conclure que les variables sont dépendantes dès qu'on observe les moindres 
petits écarts entre les distributions conditionnelles. Car enfin, des variables 
indépendantes, cela existe ! Nous aborderons cette question dans la section 
3.6 ; pour l'instant, nous continuerons à ne déclarer indépendantes que les 
variables dont les distributions conditionnelles sont strictement identiques. 


3.5 


Exemple 2 


DÉPENDANCE ET CAUSALITÉ 


Il est rare que l'on étudie la dépendance entre deux variables sans envisager, 
par le fait même, la possibilité d'un lien de causalité entre les variables. 
Considérez, par exemple, les nombreuses études qui établissent, d'une façon 
ou d'une autre, l'existence d'un lien entre l'état de santé et la consommation 
de cigarettes. Si, par des moyens statistiques, on démontre qu'il existe un 
lien entre ces deux variables, on résiste difficilement à la tentation de 
conclure que la cigarette « cause » la maladie. Si cette conclusion est 
vraisemblable, elle n'est pas évidente, et il demeure important de se rendre 
compte des risques qu'il y a à identifier trop hâtivement une variable à la 
cause, l'autre à l'effet. Il peut arriver que la dépendance entre deux variables 
soit due, non pas à l'effet de l'une sur l'autre, mais à l'effet simultané d'une 
troisième variable sur les deux premières. Nous illustrons ce phénomène, 
encore une fois, à l'aide d'un exemple idéalisé. 


Imaginez une expérience faite avec 300 rats atteints d'une certaine maladie. 
Soit X la pression artérielle et Y une variable qui identifie les conséquences 
éventuelles de la maladie. Supposons que l'expérience donne les résultats 
suivants : 


Y : conséquences de la maladie 


X : pression artérielle TOTAL 
Succombe Survit 
Élevée 136 44 180 
Normale 64 56 120 
TOTAL 200 100 300 


On constate que le taux de mortalité est de 75,6 % parmi ceux qui ont une 
pression élevée alors qu'il n'est que de 53,3 % parmi ceux ayant une 
pression normale. Peut-on conclure que la pression élevée est la cause de ce 
taux de mortalité plus élevé ? C'est possible, mais avant de tirer cette 
conclusion on décide d'examiner une fois de plus les données à la lumière de 
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l'information qu'on possède sur l'âge des rats. Il y en a 100 qu'on classifie 
comme « jeunes » et 200 qu'on classifie comme « vieux ». Pour chacun de ces 
deux groupes, on dresse un tableau comme le tableau ci-dessus. On obtient 
les résultats suivants : 


Jeunes 
Y : conséquences de la maladie 
X : pression artérielle TOTAL 
Succombe Survit 
Élevée 8 12 20 
Normale 32 48 80 
TOTAL 40 60 100 
Vieux 
Y : conséquences de la maladie 
X : pression artérielle TOTAL 
Succombe Survit 
Élevée 128 32 160 
Normale 32 8 40 
TOTAL 160 40 200 


Parmi les jeunes, le taux de mortalité est de 40 %, quelle que soit la 
pression. Parmi les vieux, le taux de mortalité est de 80 %, quelle que soit la 
pression. Donc, contrairement à la conclusion suggérée par le premier 
tableau, la pression n'agit pas de façon directe sur la mortalité. C'est 
apparemment l'âge qui agit en même temps sur la pression et sur la 
mortalité. + 


3.6 


UN TEST D'INDÉPENDANCE 


Nous attaquons maintenant la question soulevée dans la remarque relative à 
l'exemple 1 (page 84). Deux variables sont indépendantes, selon la définition, 
si la distribution conditionnelle de l'une étant donné la valeur de l'autre ne 
dépend pas de la valeur de cette seconde variable. Or, en pratique, cette 
situation ne se produit presque jamais : une certaine dépendance se 
manifeste inévitablement dans les données, même si les deux variables sont, 
en théorie, parfaitement indépendantes (par exemple, les résultats de 
plusieurs lancers simultanés d'un dé rouge et d'un dé vert). Si la dépendance 
qui se manifeste dans les données expérimentales est si faible qu'elle peut 
être attribuée au simple jeu du hasard, rien ne s'oppose à ce que les deux 
variables soient en réalité parfaitement indépendantes. Cela tient au fait que 
toute affirmation relative à la dépendance ou à l'indépendance de variables 
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se fait à propos d'une population, que l'on doit considérer mathémati- 
quement comme infinie et abstraite et non concrète et finie. Affirmer que 
deux variables sont indépendantes (dans la population théorique), malgré 
des distributions conditionnelles observées non identiques ne constitue donc 
pas une contradiction. Nous illustrons ces notions à l'aide des données du 
tableau 3.5. 


TABLEAU3.5 Distribution de l'âge de la mère (X) et du sexe de l'enfant (Y) - naissances au Canada, 1971 


Y : sexe de l'enfant 


X : âge de la mère TOTAL 
Masculin Féminin 

19 ans et moins 20 956 19 524 40 480 

De 20 à 24 ans 63 927 60 383 124 310 

De 25 à 29 ans 56 153 52 671 108 824 

30 ans et plus 38 751 36 503 75 254 

Population totale 179 787 169 081 348 868 


SOURCE : Recensement du Canada, 1971. 


TABLEAU36 Distributions conditionnelles du sexe de l'enfant (Y) étant donné l'âge de la mère (X) 


Y : sexe de l'enfant 


X : âge de la mère TOTAL 
Masculin Féminin 

19 ans et moins 0,518 0,482 1,000 

De 20 à 24 ans 0,514 0,486 1,000 

De 25 à 29 ans 0,516 0,484 1,000 

30 ans et plus 0,515 0,485 1,000 

Population totale 0,515 0,495 1,000 


Ce tableau donne, pour la population de 348 868 naissances qui ont eu lieu 
au Canada en 1971, la distribution conjointe des deux variables suivantes : 


X : Âge de la mère 


Y : Sexe de l'enfant 
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On s'attend à ce que ces variables soient indépendantes : il n'y a aucune 
raison de croire que l'âge de la mère a une influence sur le sexe du bébé. 
Toutefois, on se propose de le vérifier de façon empirique. On calcule donc 
les distributions conditionnelles du sexe du bébé étant donné l'âge de la mère. 
Les résultats sont dans le tableau 3.6. 


Comme on devait s'y attendre, les distributions conditionnelles ne sont pas 
rigoureusement identiques : le pourcentage de garçons est 51,8 pour les 
mères de 19 ans et moins, et 51,4 pour les mères de 20 à 24 ans. Quelle 
crédibilité peut-on accorder à ces écarts ? Peut-on affirmer, par exemple, 
qu'une femme de 19 ans et moins a plus de chances d'avoir un garçon ? La 
réponse, comme nous le verrons plus bas, est non : on ne peut pas affirmer 
qu'une femme de 19 ans et moins a plus de chances - ni même un tout petit 
peu plus de chances -— d'avoir un garçon. 


Nous n'affirmons pas que la fréquence observée des garçons est la même 
dans chaque groupe d'âge ; nous affirmons que la probabilité d'avoir un 
garçon peut être la même pour chaque groupe d'âge. 


Si les probabilités sont égales pour chaque groupe d'âge, alors les fréquences 
devraient être à peu près égales. Si les fréquences ne sont pas égales mais 
presque, on attribue la différence au hasard. Si elles sont très différentes, le 
hasard devient une explication peu convaincante, et il faut alors remettre en 
question l'hypothèse de départ - l'hypothèse selon laquelle les probabilités 
sont égales. 


Le reste de cette section est consacré à une procédure, semblable à celle 
présentée au chapitre 1, qui permet de juger de l'importance des écarts entre 
les fréquences échantillonnales et de décider si ces écarts peuvent être 
attribués au hasard ou non. 


On commence par formuler une hypothèse, appelée hypothèse nulle. 
L'hypothèse nulle, dans cette section, est l'hypothèse que les deux variables 
sont indépendantes. La procédure ensuite suit les mêmes étapes que la 
procédure décrite au chapitre 1. 


a) On construit un tableau d'effectifs théoriques. Ce tableau indique les 
effectifs auxquels on s'attend lorsque l'hypothèse nulle est vérifée. 
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b) On calcule une mesure y? des écarts entre les effectifs théoriques et 
les effectifs observés. On rejette l'hypothèse nulle si la valeur de y? est 
supérieure à un point critique trouvé comme dans le tableau 1.8 


(page 18). 


Les effectifs théoriques Les effectifs théoriques sont les effectifs auxquels 
on s'attend lorsque les variables sont indépendantes. Il existe une façon 
mécanique de les calculer, nous l'illustrerons dans l'exemple suivant. Plus 
loin, nous montrerons, à l'aide des données sur les naissances, par quel 
raisonnement on arrive aux effectifs théoriques. Lorsque les variables sont 
indépendantes, les distributions conditionnelles sont identiques - non 
seulement entre elles mais également à la distribution marginale. Autrement 
dit, les proportions de garçons et de filles devraient être les mêmes pour 
chaque groupe d'âge que pour la population entière. La proportion de 
garçons pour la population entière est, d'après le tableau 3.5, 179 787 + 
348 868 = 0,515 343 9 (C'est le nombre qu'on retrouve, avec moins de 
décimales, au bas du tableau 3.6). Si les variables sont indépendantes, ce 
même pourcentage devrait s'appliquer à tous les groupes d'âge. 


Parmi les 40 480 mères de 19 ans et moins, le nombre de garçons devrait 

être 
40 480 x 0,515 343 9 = 20 861 

Parmi les 124 310 mères de 20 à 24 ans, le nombre de garçons devrait être 
124 310 x 0,515 343 9 = 64 062 

Parmi les 108 824 mères de 25 à 29 ans, le nombre de garçons devrait être 
108 824 x 0,515 343 9 = 56 082 


Nous venons de calculer les effectifs théoriques correspondant à trois des 
huit cases du tableau 3.5. On pourrait, par le même raisonnement, remplir 
les cinq cases qui restent, mais on peut également le faire par soustraction 
car les effectifs marginaux restent inchangés. Donc, si parmi les 40 480 
enfants nés d'une mère de 19 ans et moins on s'attend à avoir 20 861 
garçons, alors on s'attend à avoir 40 480 — 20 861 = 19 619 filles. Le tableau 
3.7 donne les effectifs théoriques (sous l'hypothèse d'indépendance). 
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TABLEAU 3.7 Âge de la mère (X) et sexe de l'enfant (Y) - effectifs théoriques 


Y : sexe de l'enfant 


X : âge de la mère TOTAL 
Masculin Féminin 

19 ans et moins 20 861 19 619 40 480 

De 20 à 24 ans 64 062 60 248 124 310 

De 25 à 29 ans 56 082 52 742 108 824 

30 ans et plus 38 782 36 472 75 254 

Population totale 179 787 169 081 348 868 


Le khi-deux Les effectifs observés doivent maintenant être comparés aux 
effectifs théoriques. Comme mesure globale de l'écart entre le tableau des 
effectifs observés (tableau 3.5) et le tableau des effectifs théoriques (tableau 
3.7), nous utilisons la mesure y? employée au chapitre 1 : 


(O-T) 
— 


1 => 


On peut aussi considérer cette quantité comme une mesure de la 
dépendance qui se manifeste dans les données : si la dépendance est forte, 
les effectifs observés s'écartent des effectifs théoriques et y? prend une valeur 
grande. Si la valeur y? est très grande, c'est que les données prennent une 
allure de dépendance qui est trop forte pour être attribuée au hasard. 


Nous calculons la valeur de 7? : 


2 


(20 956 -20 861)? (19524-19619)? (63927-64062)? (60 383 -60 248)? 
X°= + + + 


20 861 19 619 64 062 60 248 


(56153-56082)? (52671-52742)? (38751-38782)? (36503-36472)? 
+ + + + 
56 082 52 742 38 782 36 472 
= 0,433 + 0,460 + 0,284 + 0,302 + 0,090 + 0,096 + 0,025 +0,026 
= 1,72 


Il s'agit maintenant de déterminer si cette valeur est « trop grande », c'est- 
à-dire, de la comparer à un certain point critique. Le point critique dépend 
du nombre de degrés de liberté v, lequel est fonction du nombre de lignes et 
de colonnes dans le tableau. Il est donné par : 


v = (nombre de lignes — 1) x (nombre de colonnes -— 1) 
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Cette formule peut être démontrée, mais il faudrait pour cela recourir à des 
techniques passablement avancées relevant de la théorie des probabilités. Par 
contre, on peut l'illustrer, par exemple, dans le tableau 3.5 : tout en 
respectant les totaux des lignes et des colonnes, on peut remplir « librement » 
(4 —- 1) x (2 — 1) = 3 cases. Voici, schématiquement, 3 façons de le faire (vérifiez) 


Dans notre tableau, il y a 4 lignes et 2 colonnes. Donc, le nombre de degrés 
de liberté est : 


vessie x Ts 


D'après le tableau 1.8 (page 18), le point critique est 7,82. Puisque la valeur 
1,72 obtenue pour ÿ?, n'est pas supérieure à 7,82, nous ne rejetons pas 
l'hypothèse nulle. Voici deux façons d'énoncer cette conclusion : 


a) La dépendance qui se manifeste dans les données, et qui est mesurée 
par x? est assez faible pour pouvoir être attribuée au hasard 
seulement — et non à une vraie dépendance. 


b) Les écarts observés entre les données observées et les données 
théoriques (issues de l'hypothèse d'indépendance) et mesurés par le 
x? ne sont pas assez forts pour entraîner le rejet de l'hypothèse 
d'indépendance. 


Exemple 3 Les données du tableau 3.8 portent sur 252 couples mariés américains, 
classifiés selon le rang social du père du mari (X) et le rang social du père de 
l'épouse (Y]. 
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TABLEAU 3.8 


TABLEAU 3.9 


Échantillon de 252 couples américains - rang social du père du mari (X) et du père de l'épouse (Y) 


Y : rang social du père de l'épouse 


X : rang social du père du mari Professionnel  C2MMiIs ou Os ron TOTAL 
ou gérant TA spécialisé 
spécialisé 
Professionnel ou gérant 44 39 13 96 
Commis ou ouvrier spécialisé 21 38 29 88 
Ouvrier non spécialisé 12 24 32 68 
TOTAL 77 74 252 


SOURCE : Katz (1978) 


Les variables sont-elles indépendantes ? L'hypothèse nulle est qu'elles le sont. 


Pour calculer les effectifs théoriques, nous utilisons la formule « mécanique » 
qui découle de l'indépendance (voir le début de la section 3.4, caractéristique 
c) : lorsque les variables sont indépendantes, l'effectif d'une case est égal au 
produit du total de la ligne par le total de la colonne, divisé par l'effectif total. 
Le tableau 3.9 présente l'ensemble des effectifs théoriques ainsi obtenus. 


Effectifs théoriques 
TOTAL 
96 x 77 96 x 101 96 x 74 
= 29,333 = 38,476 = 28,191 96 
252 252 252 
88 x 77 88x101 88 x 74 
= 26,889 = 35,270 = 25,841 88 
252 252 252 
68 x 77 68x101 68 x 74 
= 20,778 = 27,254 = 19,968 68 
252 252 252 
TOTAL 77 101 74 252 


SOURCE : Tableau 3.8 


La valeur de 72 est : 


2 


(44-29,333)? (39-38,476)? (13 -28,191)° (32 - 19,968)? 
: + + +... + 


29,333 


38,476 


28,191 


= 7,334 +0,007 + 8,186 +... +7,25 


=28,76 


19,968 


TABLEAU 3.10 
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Distributions conditionnelles de Ÿ étant donné X 


Y : rang social du père de l'épouse 


ÿ Commis ou : 
Professionnel : Ouvrier non TOTAL 
: ouvrier Le Aa ie 
ou gérant PRÉTRERE spécialisé 
spécialisé 


X : rang social du père du mari 


Professionnel ou gérant 0,46 0,41 0,13 1,00 
Commis ou ouvrier spécialisé 0,24 0,43 0,33 1,00 
Ouvrier non spécialisé 0,18 0,35 0,47 1,00 


SOURCE : Tableau 3.8 


Puisque v = (3 — 1)(3 —- 1) = 2 x 2 = 4, le point critique est 9,49. La valeur de 
x? étant bien supérieure au point critique, nous rejetons l'hypothèse nulle. Il 
semble bien y avoir une dépendance entre les deux variables. Le tableau 
3.10 qui donne les distributions conditionnelles de Y étant donné X révèle la 
nature de cette dépendance : grosso modo, les hommes de rang social élevé 
épousent des femmes de rang social élevé, et vice-versa. + 


Remarque ll n'est pas toujours nécessaire d'effectuer le calcul complet du 7° ; 
dans l'exemple précédent, on voit que la somme des trois premiers termes est 
15,527, ce qui suffit à assurer que le y? dépasse le point critique et à conclure 
à la dépendance. 


Mise en garde La procédure décrite dans cette section est basée sur des 
calculs de probabilité approximatifs et n'est valable que pour des échantillons 
assez grands. En pratique, on évite d'employer le test du khi-deux lorsque le 
tableau des effectifs théoriques comprend des effectifs inférieurs à 5, ou 
encore on regroupe certaines classes afin que tous les effectifs théoriques 
soient au moins égaux à 5. 


RÉSUMÉ 


1. La distribution conjointe de deux variables X et Y fait correspondre à 
chaque paire (x, y), où x est une valeur de X et y une valeur de Y, un 
effectif ou une fréquence. D'un tableau qui donne la distribution 
conjointe de X et Y on peut obtenir, en prenant la somme des lignes et la 
somme des colonnes, la distribution de X et la distribution de Y. Ces 
distributions sont alors appelées distributions marginales. La 
distribution conditionnelle de Y étant donné X = x, est la distribution 
de Ÿ confinée à une tranche de la population, l'ensemble de tous ceux 
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pour qui X = x. Il existe donc une distribution conditionnelle de Y pour 
chaque valeur de X. De même, il y a une distribution conditionnelle de X 
pour chaque valeur de Y. 


Deux variables X et Y sont indépendantes si et seulement si elles 
satisfont l'une ou l'autre des quatre conditions équivalentes suivantes : 


a) Les distributions conditionnelles de Y, exprimées en fréquences, sont 
identiques entre elles et sont donc identiques à la distribution 
marginale de Y. 


b) Les distributions conditionnelles de X, exprimées en fréquences, sont 
identiques entre elles et sont donc identiques à la distribution 
marginale de X. 


c) Pour toute ligne 1 et toute colonne j, l'effectif de la case située à 
l'intersection de la ligne i et de la colonne j est égal à : 


(total de la ligne à x (total de la colonne) + (effectif total) 


d) Pour toute ligne i et toute colonne j, la fréquence de la case située à 
l'intersection de la ligne 1 et de la colonne j est égale au produit des 
fréquences marginales de la ligne i et de la colonne J. 


Une dépendance entre deux variables n'est pas nécessairement due à 
l'effet de l'une sur l'autre. Elle peut résulter de l'effet simultané d'une 
troisième variable sur les deux premières. On peut parfois éliminer cet 
effet lorsqu'on dispose des données nécessaires, en gardant cette 
troisième variable fixe. 


Pour tester l'hypothèse que deux variables sont indépendantes, on 
procède de la façon suivante : 


a) On dresse un tableau d'effectifs théoriques. Les effectifs théoriques 
sont calculés à partir des effectifs marginaux en employant la 
définition 2 c) ci-dessus. 


b) On mesure l'écart entre le tableau des effectifs théoriques et le 
tableau des effectifs observés par : 


O=T) 
; ) 
r 


Le — 
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c) On rejette l'hypothèse d'indépendance si la valeur de y? est 
supérieure à un point critique trouvé dans le tableau 1.8 (page 18). 
Le nombre v de degrés de liberté est donné par : 


v = (nombre de lignes — 1) x (nombre de colonnes -— 1) 


Le test du khi-deux est approximatif. On devrait éviter de l'employer 
s'il y a des effectifs théoriques inférieurs à 5. 


EXERCICES 


DISTRIBUTIONS 1: 
CONJOINTE, 
MARGINALE ET 
CONDITIONNELLE 


INDÉPENDANCE 


Consultez le tableau 3.2 (page 80) et dites lesquelles des affirmations 
suivantes à propos des bébés québécois nés en 1983 sont vraies. Pour 
celles qui sont fausses, déterminez le vrai pourcentage. 


a) 51,8 % des bébés étaient des garçons. 

b) 1,9 % des bébés avaient un poids faible. 

c) 9,9 % des garçons avaient un poids moyen. 

d) 5,6 % des bébés étaient des garçons et avaient un poids très élevé. 
e) 12,8 % des bébés de poids moyen étaient des filles. 


a) Montrez que les variables de l'exemple 1 (page 84) sont 
indépendantes en vérifiant que l'effectif d'une case est égal au produit 
du total de la ligne par le total de la colonne, divisé par l'effectif total. 


b) Exprimez la distribution conjointe du même exemple en fréquences. 
Les fréquences vérifient une propriété analogue à celle qu'on 
demande de vérifier en a). Quelle est-elle ? Énoncez-la clairement. 


Déterminez, à partir du tableau 3.5 (page 87) : 

a) la distribution marginale de l'âge de la mère. 

b) la distribution marginale du sexe de l'enfant. 

c) chacune des distributions conditionnelles possibles. 


Déterminez, à partir du tableau 3.8 (page 92), la distribution 
conditionnelle de X étant donné chacune des valeurs de Y. 


Le tableau 3.11 donne, pour une population de 68 297 mariages ayant 
eu lieu au Canada en 1984, la distribution de la religion de l'époux (X) et 
de la religion de l'épouse (Y). Dressez un tableau qui expose clairement la 
forte dépendance existant entre ces variables. 
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TABLEAU 3.11 


TABLEAU 3.12 


DÉPENDANCE 
ET CAUSALITÉ 


Religion de l'époux (X) et de l'épouse (Ÿ) - quatre principales religions, Canada - 1984 


Ftiot Y : religion de l'épouse 
” religion de g P TOTAL 
époux Anglicane Baptiste Catholique Église Unie 
Anglicane 5 469 500 4270 2 740 12 979 
Baptiste 480 2031 861 613 3 985 
Catholique 4 106 806 23 632 4 898 33 442 
Église Unie 2 673 563 5 023 9 632 17 891 
Total 12 728 3 900 33 786 17 883 68 297 
SOURCE : Annuaire du Canada, 1986-87 
Mortinaissances et naissances vivantes selon l'âge de la mère - 1974 
Âge de la mère < 20 20-24 25-29 30-34 35-39 40-44 > 45 
Naissances vivantes 38 626 111409 119 239 48 142 14 133 3 333 226 
Mortinaissances 316 757 836 402 232 81 10 


SOURCE : Annuaire du Canada, 1976-1977 


6. Le tableau 3.12 donne, pour un ensemble de naïssances ayant eu lieu au 


Canada en 1974, la distribution de l'âge de la mère (X) et de l'état du 
bébé (Y : mort, vivant). 


a) Déterminez les distributions conditionnelles de YŸ étant donné les 


valeurs de X. 


b) Déterminez les distributions conditionnelles de X étant donné les 
valeurs de Y. 


c) Comme façon d'exposer la dépendance entre deux variables, laquelle 
des deux séries de distributions conditionnelles vous semble plus 
naturelle ? 


7. Un fabricant de détersifs, avec la coopération de cent supermarchés, se 


livre à une expérience dans le but d'étudier l'effet sur les ventes de deux 
variables : l'emballage (bleu ou rouge) et l'emplacement sur l'étalage (au 
niveau des yeux ou au niveau des chevilles). Chaque magasin expose le 
produit, soit dans l'emballage bleu, soit dans l'emballage rouge ; et soit au 
niveau des yeux, soit au niveau des chevilles. Après deux semaines, on 
évalue les ventes dans chaque magasin : on les qualifie de « bonnes » ou 
de « mauvaises » selon les critères propres à chaque magasin (pour tenir 
compte des particularités du magasin). Voici les résultats : 
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Emplacement 


Niveau des yeux Niveau des chevilles 
Ventes 
Emballage Emballage 
Bleu Rouge Bleu Rouge 
Bonnes 4 36 8 2 
Mauvaises 6 4 32 8 


Dressez des tableaux qui permettent de répondre clairement aux 
questions suivantes : 


a) Est-ce que l'emballage a un effet sur les ventes ? 
b) Est-ce que l'emplacement a un effet sur les ventes ? 


8. Supposons que dans le cadre d'une étude sur la discrimination sexuelle, 
le service du personnel d'une compagnie prélève un échantillon de 900 
employés qu'il classifie selon le sexe (X), le salaire (Y) et la catégorie 
d'emploi. La question est de savoir si les femmes sont moins bien payées 
que les hommes. Chacun des exemples suivants montre qu'on peut 
arriver à des conclusions différentes selon qu'on sépare les deux 
catégories d'emploi ou non. Dans chacun des cas suivants, tirez vos 
conclusions à partir des deux tableaux. Combinez ensuite les deux 
tableaux pour voir à quelle conclusion vous seriez arrivés si vous n'aviez 
pas séparé les catégories d'emploi. 


a) Emplois techniques Emplois administratifs 
Y : salaire Y : salaire 
X:sexe X:sexe 
< 30 000 > 30 000 < 30 000 > 30 000 
Femmes 25 100 Femmes 75 100 
Hommes 150 125 Hommes 50 275 
b) Emplois techniques Emplois administratifs 
Y : salaire Y : salaire 
X:sexe X:sexe 
< 30 000 > 30 000 < 30 000 > 30 000 
Femmes 22 78 Femmes 268 132 


Hommes 150 150 Hommes 82 18 
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10. 


11. 


c) Emplois techniques Emplois administratifs 
Y : salaire Y : salaire 
X:sexe X:sexe 
< 30 000 > 30 000 < 30 000 > 30 000 
Femmes 125 175 Femmes 15 85 
Hommes 75 25 Hommes 85 315 


Essayez d'expliquer les contradictions sans employer de langage 
technique. 


. Testez, avec les donnés du tableau 3.11, l'hypothèse que la religion de 


l'époux et celle de l'épouse sont indépendantes. Exprimez clairement 
votre conclusion. 

Testez, avec les données du tableau 3.12, l'hypothèse que le taux de 
mortinatalité ne dépend pas de l'âge de la mère. 


À la page 25 du rapport « École et luttes de classes au Québec » publié 
par la Centrale des enseignants du Québec, les auteurs affirment « qu'il 
existe une relation très nette entre la scolarité et la classe sociale 
d'appartenance » et que « les pères de classe sociale supérieure ont aussi 
une formation supérieure ». L'un des tableaux fournis à l'appui de ces 
affirmations donne la distribution de la classe sociale et du niveau de 
scolarité du père de 5 582 élèves du secondaire. Faites un test pour 
déterminer si les affirmations sont justifiées. 


Élémentaire 
ou moins 


Sans 


Scolarité Ë 
réponse 


Secondaire Collégial Universitaire TOTAL 


Élèves de 
classe 108 192 152 137 10 599 
supérieure 


Élèves de 
classe 527 667 392 118 20 1 724 
intermédiaire 


Élèves de 
classe 1752 1 076 318 44 69 3 259 
inférieure 


Remarque Cette dépendance entre le niveau de scolarité et le niveau de la 
classe sociale n'a rien d'étonnant puisqu'elle est imposée par la définition 
même de classe sociale. La classe sociale d'un élève est définie selon 
l'occupation du père. Or, le rang social attribué à une occupation est 
fortement lié à la scolarité nécessaire pour y accéder. 


DIVERS 
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12. À la page 24 du rapport cité à l'exercice 11, les auteurs affirment que « le 


phénomène drop-out et surtout l'abandon des études touchent davantage 
les enfants de classe sociale inférieure ». Cette affirmation est basée sur 
les données suivantes, qui représentent une classification de 6 930 
élèves de l'élémentaire, du secondaire et du collégial selon leur classe 
sociale : 


Classe 
Niveau TOTAL 
Supérieure Intermédiaire Inférieure 
Élémentaire 31 112 256 399 
Secondaire 599 1 724 3 259 5 582 
Collégial 123 334 492 949 


a) Déterminez les distributions conditionnelles qui ont pu mener à la 
conclusion citée plus haut. 


b) Faites un test pour déterminer si la conclusion est justifiée. 


Les données suivantes sur les renouvellements des abonnements à la 
revue American History lllustrated en janvier et février 1979 ont été 
recueillies par Wagner (1982). Les variables sont X (janvier, février) et Y 
(abonnement renouvelé ou non). Voici la distribution conjointe des deux 
variables : 


Y : abonnement renouvelé 


X : mois 

Oui Non 
janvier 21 749 21071 
février 4733 2155 


a) Le taux de renouvellement s'est-il amélioré en février par rapport à 
janvier ? 


b) Les tableaux suivants présentent les distributions séparément pour 
chaque catégorie d'abonnement. Les catégories sont : À, cadeaux ; B, 
anciens renouvellements ; et C, service commercial d'abonnement. 


A Y : abonnement renouvelé 


X : mois Oui Non 


janvier 2918 676 
février 704 180 
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B Y : abonnement renouvelé 
X : mois Oui Non 
janvier 14 488 3 876 
février 3 907 1 233 
C Y : abonnement renouvelé 
X : mois Oui Non 
janvier 4 343 16 519 
février 122 742 


Peut-on maintenant dire que le taux de renouvellement s'est amélioré 
entre janvier et février ? Expliquez la contradiction apparente entre 
les résultats en a) et en b). 


14. Voici la répartition de 6 459 francophones québécois selon la 
connaissance de l'anglais et l'origine ethnique (Vaillancourt et Lefebvre, 


1979) : 
Origine ethnique 
5 3 TOTAL 
Française Anglaise Autres 
Unilingues 3 156 142 116 3 414 
Connaissent l'anglais 2 667 193 185 3 045 
TOTAL 5 823 335 301 6 459 


a) Testez l'hypothèse qu'il n'y a pas de différence entre les gens d'origine 
française, anglaise et autres quant au pourcentage d'unilingues. 


b) Faites un test pour comparer seulement ceux d'origine anglaise et 
ceux d'origine française. 


15. Dans une certaine expérience en marketing (Carefoot, 1982), on a choisi 
800 consommateurs (le groupe expérimental) à leur entrée dans un 
supermarché. On a incité ces consommateurs à venir visionner 5 
annonces publicitaires dans une roulotte installée sur le terrain de 
stationnement avant de faire leurs emplettes. À la sortie, ils présentaient 
une carte magnétique qui, à l'aide d'un appareil branché à la caisse 
enregistreuse, permettait de dresser une liste complète de leurs achats. 
On pouvait donc savoir lesquels des articles dont les consommateurs 


16. 
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avaient vu les annonces ont été achetés par chacun d'eux. Parallèlement, 
on a choisi un groupe témoin de 800 personnes à qui on n'a pas fait 
visionner les annonces. Dans le tableau suivant, on donne pour trois des 
cinq articles annoncés le nombre de personnes dans chaque groupe qui 
l'ont acheté. 


Article Groupe témoin Groupe expérimental 
Savon A 15 17 
Céréales B 31 44 
Dîner congelé C 12 24 


Pour chacun des produits, testez l'hypothèse que l'annonce n'a pas 
d'effet. Cette expérience, faite avec un échantillon de 800 personnes pour 
chaque groupe, se révèle plutôt onéreuse. À la lumière des résultats 
obtenus pour le dîner congelé, peut-on dire que des échantillons de cette 
taille étaient nécessaires ? 


Les données suivantes proviennent d'une étude (Lynn, 1981) qui visait à 
déterminer les caractéristiques de ceux qui lisent les annonces publicitaires 
(les « lecteurs ») et de ceux qui ne les lisent pas (les « non-lecteurs »). Dans 
chacun des cas, dites s'il y a un lien entre la variable indiquée et le fait de 
lire les annonces ou pas. 


Lecteur ou non des annonces publicitaires 


État matrimonial 


Lecteur Non-lecteur 
Marié 666 200 
Pas marié 216 48 


Lecteur ou non des annonces publicitaires 


Scolarité 

Lecteur Non-lecteur 
Secondaire ou moins 593 159 
Université 276 96 

Lecteur ou non des annonces publicitaires 

Sexe 

Lecteur Non-lecteur 
Femmes 377 177 


Hommes 504 79 
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Lecteur ou non des annonces publicitaires 
Taille de la famille 


Lecteur Non-lecteur 
1 100 27 
2 302 87 
3 192 55 
4 170 54 
5+ 118 34 


17. Pour comparer l'aptitude en mathématique des étudiants orientaux et 


18. 


des étudiants américains de race blanche, Tsang (1984) a examiné la 
distribution des résultats au test de mathématiques du SAT (Scholastic 
Aptitude Test) de 10 097 étudiants orientaux et de 502 990 étudiants 
américains de race blanche. Les distributions pour les deux populations 
sont données dans le tableau suivant : 


Origine 
Score au SAT-mathématiques 
Orientaux Américains de race blanche 

700-800 601 22 564 
600-690 2 001 86 521 
500-590 3 190 158 049 
400-490 2788 151 466 
300-390 1 309 74 498 
200-290 208 9 892 

10 097 502 990 


Testez l'hypothèse que la distribution des scores des Orientaux est la 
même que celle des Américains de race blanche. 


Dans le cadre d'une étude sur les pressions exercées par les sectes 
fondamentalistes sur la programmation à la télévision, Rubens (1981) a 
fait remplir un questionnaire à 440 sujets. Le questionnaire lui a permis 
de classer chaque sujet selon son « degré de fondamentalisme ». Il a en 
outre posé un certain nombre de questions d'opinion. Testez l'hypothèse 
d'indépendance entre le degré de fondamentalisme et chacune des 
opinions exprimées. 


Réglementation de la presse 
Il faudrait qu'il y ait plus de réglementation 
pour régir le contenu des journaux Zéro Faible Fort Très fort 


Degré de fondamentalisme 


D'accord 15 25 35 38 
Pas d'accord 81 70 60 7 
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Bibliothèque . Degré de fondamentalisme 

Tout livre devrait être autorisé dans les 

bibliothèques Zéro Faible Fort Très fort 
D'accord 85 77 59 52 
Pas d'accord 13 20 36 47 
Télévision | : . Degré de fondamentalisme 

Tout sujet devrait pouvoir être traité à la 

télévision Zéro Faible Fort Très fort 
D'accord 88 80 67 56 
Pas d'accord 8 15 27 37 


19.Le tableau suivant donne la répartition de 7 187 francophones du 
Québec selon le lieu de naissance et la connaissance de l'anglais. 
(Vaillancourt et Lefebvre, 1979). 


a) Testez l'hypothèse que la proportion d'unilingues est la même parmi 
ceux qui sont nés au Québec et parmi ceux venant d'un pays 
anglophone. 


b) Considérez comme appartenant à un même groupe ceux qui sont nés 
au Québec et ceux qui sont nés dans un pays francophone. Testez 
l'hypothèse que dans ce nouveau groupe, la proportion d'unilingues 
est la même que parmi ceux des pays anglophones et que parmi ceux 
des autres pays. 


Lieu de naissance 


= Pays Pays 
Que francophones anglophones Autres pays 
Taille de 
l'échantillon 6 868 133 164 22 
Nombre 3770 72 35 ; 
d'unilingues 


20. Considérez la distribution conjointe suivante : 


Y 
X TOTAL 
y: y2 
x 0,3 0,1 0,4 
X2 0,4 0,2 0,6 


TOTAL 0,7 0,3 1,0 
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21. 


22. 


23. 


a) Dressez le tableau des distributions conditionnelles de Y. 
b) Testez l'hypothèse d'indépendance en supposant que : 
i) l'effectif total est 100 ; 
ii) l'effectif total est 1 OO0. 
c) Expliquez pourquoi il y a une différence entre vos deux réponses. 


Les données suivantes portent sur 17 060 diplômés d'université (Service 
général des communications, « Relance à l'Université », ministère de 
l'Éducation du Québec, 1979). Les diplômés sont classés selon leur 
statut en 1978 et la scolarité de leur père : 


Statut du diplômé 


Scolarité du père : TOTAL 
Aux études Au travail Inactif ou en 
chômage 

Secondaire ou 808 11 160 591 12 559 
moins 

us auels 544 3 727 230 4501 
secondaire 

TOTAL 1 352 14 887 821 17 060 


a) Testez l'hypothèse selon laquelle il n'y a pas de dépendance entre le 
statut du diplômé et la scolarité du père. S'il y a dépendance, 
décrivez-en la nature. 


b) Ÿ a-t-il une dépendance entre le statut du diplômé et la scolarité du 
père parmi ceux qui ne sont pas aux études ? 


Utilisez les données du tableau 3.11 pour tester à tour de rôle chacune 
des hypothèses suivantes : 


a) la probabilité qu'un homme épouse une coreligionnaire est la même 
pour les quatre religions ; 


b) 50 % des femmes baptistes épousent des coreligionnaires ; 


c) 50 % des mariages entre Catholiques et Baptistes sont des mariages 
entre un homme catholique et une femme baptiste. 


Les données suivantes portent sur 289 usines portoricaines qui ont 
fermé leurs portes entre 1973 et 1980 pour l'une des raisons suivantes : 
A, problèmes de marché ; B, problèmes financiers ; et C, problèmes 
d'opérations. Les usines sont classées selon le nombre d'employées (X) et 
la raison principale pour laquelle elles ont fermé leurs portes (Y). 


24. 


25. 


26. 
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Y : raison principale de la fermeture de l'usine 


X : nombre d'employées 


A B C 

5-9 35 27 5 
10-49 58 39 32 
50+ 48 16 29 


SOURCE : Constas (1981) 


Dressez un tableau qui présente ces données sous une forme plus 
instructive, et discutez les conclusions qu'on peut en tirer. 


En 1974, 4 974 hommes baptistes se sont mariés, dont 2 222 à des 
coreligionnaires. Connaissant les données pour 1984 (tableau 3.11), 
pouvez-vous dire que la tendance chez les hommes baptistes à épouser 
des coreligionnaires a changé entre 1974 et 1984 ? Commentez. 


Les données suivantes portent sur 17 059 diplômés d'université en 1974 
— 1975, rejoints en 1978 (Service général des communications, « Relance à 
l'Université », ministère de l'Éducation du Québec, 1979). Les diplômés 
sont classés selon leur statut en 1978 et leur langue maternelle. 


Statut du diplômé 


Langue | 

maternelle Aux études Au travail Inactif ou en TOTAL 
chômage 

Français 448 2 294 145 2 887 

Anglais 757 11 267 547 12 571 

Autres 217 1 234 150 1 601 

TOTAL 1 422 14 795 842 17 059 


a) Testez l'hypothèse selon laquelle le statut du diplômé ne dépend pas 
de sa langue maternelle. 


b) Testez l'hypothèse selon laquelle parmi ceux qui ne sont pas aux 
études, le taux de chômage ou d'inactivité est le même pour les 
francophones, les anglophones et les allophones. 


On émet parfois l'hypothèse que le succès d'un savant dépend en partie 
de son rang dans l'ordre de sa naissance parmi ses frères ou ses sœurs. 
Les données suivantes sur les gagnants de prix Nobel ont été recueillies 
par Clark et Rice (1982) dans le but de vérifier une hypothèse 
particulière, celle que les scientifiques ont une tendance plus grande que 
les non-scientifiques à être des premiers-nés. Les prix en physique, 
chimie, médecine et économie sont considérés comme prix scientifiques ; 
les prix de littérature et de la paix sont non scientifiques. Les gagnants 
de prix Nobel qui sont fils uniques sont exclus. 


106 Introduction à la statistique appliquée 


Statut dans la famille 


Prix TOTAL 
Premier-né Cadet 

Scientifique 51 62 113 

Non-scientifique 17 45 62 

TOTAL 68 107 175 


L'hypothèse de Clark et Rice est-elle vérifiée ? 


27. La distribution suivante a été dressée par Haberman (1978) à partir de 
données fournies par le National Opinion Research Center de l'Université 
de Chicago. Les variables sont le nombre d'années de scolarité (X) et 
l'attitude face à l'avortement (Y). 


Y : attitude face à l'avortement 


X : scolarité 

Pour Mixte Contre 
Moins de 8 ans 31 23 56 
Entre 9 et 12 ans 171 89 177 
Plus de 12 ans 116 39 74 


a) Testez l'hypothèse selon laquelle X et Y sont indépendantes. 


b) Les données ci-dessus portent sur deux groupes : des catholiques et 
des protestants du nord des États-Unis. Voici la distribution pour 
chaque groupe : 


Catholiques 
X : scolarité Y : attitude face à l'avortement 
Pour Mixte Contre 
Moins de 8 ans 8 10 24 
Entre 9 et 12 ans 65 39 89 
Plus de 12 ans 37 18 43 
Protestants 
X : scolarité Y : attitude face à l'avortement 
Pour Mixte Contre 
Moins de 8 ans 23 13 32 
Entre 9 et 12 ans 106 50 88 
Plus de 12 ans 79 21 31 


La conclusion tirée en a) doit-elle être modifiée ? 


28. Pour étudier l'effet de certaines maladies sur le sommeil, Kaye, Kaye et 
Madow (1983) ont interrogé 30 personnes souffrant du cancer, 27 
personnes souffrant de maladies du coeur et 24 personnes en bonne 
santé. Ils leur ont posé la question suivante : « Avez-vous de la difficulté 


29. 


30. 
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à vous endormir ? » Le nombre de réponses affirmatives a été 12 pour 
ceux qui souffraient de cancer, 22 pour ceux qui souffraient de maladie 
de coeur, et 6 pour les personnes en bonne santé. 


a) Le cancer a-t-il un effet sur le sommeil ? 
b) Les maladies de coeur ont-elles un effet sur le sommeil ? 


Le tableau suivant présente la répartition de 151 voyages entrepris par 
des familles montréalaises, selon la direction prise et le niveau de 
scolarité du chef de famille. 


Direction prise 


Scolarité Reste du Canada TOTAL 
Québec et continent Hors continent 
américain 
0-11 ans 22 36 12 70 
12 ans+ 11 40 30 81 
TOTAL 33 76 42 151 


a) Ÿ a-t-il une dépendance entre la direction prise par les voyageurs et 
le niveau de scolarité ? 


b) Si oui, peut-on quand même défendre la thèse que le niveau de 
scolarité, comme tel, n'a pas d'influence sur le choix des vacances ? 


c) Quelles données devrait-on prélever et quelle analyse devrait-on faire 
pour défendre une telle thèse ? Dressez une série de tableaux avec 
des données fictives, desquelles on pourrait déduire i) que le niveau 
de scolarité n'a pas d'influence sur la direction prise par les 
voyageurs, et ii) que le revenu a une influence sur la direction prise 
par les voyageurs. 


Une certaine secte religieuse au Canada a des pratiques sexuelles qui, 
selon certains, favorisent les naissances de garçons. On a constaté en 
effet que parmi 50 enfants nés de cette secte en 1971, 31 étaient des 
garçons. Sachant qu'au Canada cette année-là 179 781 garçons et 
169 081 filles sont nés, peut-on affirmer que la probabilité qu'un enfant 
de cette secte soit un garçon est supérieure à la probabilité qu'un enfant 
canadien le soit ? (« enfant canadien » peut inclure les enfants de cette 
secte ou pas — la secte est trop petite pour changer perceptiblement les 
proportions). Devrait-on employer un test d'ajustement {le test vu au 
chapitre 1) ou un test d'indépendance ? Discutez. 
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*31. 


*32. 


*33. 


Arthur affirme pouvoir prédire le temps qu'il fera demain d'après 
certaines sensations qu'il ressent dans ses articulations. Pour voir si 
c'est bien vrai, on observe ses prédictions pendant 150 jours. Il a prédit 
de la pluie 100 fois, et de ces 100 fois il a effectivement plu 70 fois. Les 
50 autres fois il a prédit du beau temps et le temps a été beau 20 fois. 
Peut-on conclure qu'il a vraiment des capacités de prédiction du temps ? 


a) Un statisticien amateur procède de la façon suivante : il observe que 
les prédictions ont été correctes 90 fois sur 150. Il considère donc ses 
effectifs observés comme étant 90 et 60, et il les compare aux effectifs 
théoriques 75 et 75, à l'aide d'un test d'ajustement. Il trouve y? = 6 
avec 1 degré de liberté, ce qui est significatif. Pourquoi cette 
procédure est-elle incorrecte ? 


b) Faites le test correctement. 


La conclusion tirée au numéro 26 (que les scientifiques ont une plus 
forte tendance à être premiers-nés) pourrait bien être un artifice. Pour 
diverses raisons, dont peut-être les années auxquelles les différents prix 
ont été décernés, les scientifiques sont nés de familles moins 
nombreuses. Ce seul fait pourrait suffire à expliquer pourquoi ils sont 
plus souvent premiers-nés. Considérez les données fictives suivantes. On 
prélève un échantillon de 360 scientifiques, dont 300 appartiennent à 
des familles de 2 enfants et 60 à des familles de 3 enfants ; et un 
échantillon de 360 non-scientifiques, dont 60 appartiennent à des 
familles de 2 enfants et 300 à des familles de 3 enfants. Quel est 
théoriquement le nombre de premiers-nés parmi les non-scientifiques ? 


Pour résoudre le problème 17, un étudiant procède de la façon suivante. 
Il détermine la distribution de fréquences pour les Américains de race 
blanche : 


0,045 ; 0,172 ; 0,314 ; 0,301 ; 0,148 ; 0,020. Il fait ensuite un test 
comme celui présenté au chapitre 1 pour tester l'hypothèse que la 
distribution du score pour les Orientaux est identique à celle qu'il a 
déterminée pour les Américains de race blanche. 


a) Savez-vous pourquoi ce test n'est pas applicable ? 


b) Faites le test de la façon décrite dans ce numéro, et comparez votre 
résultat à celui du numéro 17. Pouvez-vous expliquer pourquoi les 
deux résultats sont si semblables ? 
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34. Pour comparer deux bières, on fait une expérience avec 100 amateurs de 
chaque marque. Chaque groupe affirme connaître la différence entre les 
deux et préférer nettement la sienne. On demande à chaque sujet 
d'identifier sa préférence, après avoir goûté les deux. Voici les résultats : 


Habituellement boivent 


TOTAL 
A B 
65 45 110 
Ont préféré 
35 55 90 
TOTAL 100 100 200 


Les hypothèses suivantes sont exprimées dans le langage de tous les 
jours. Exprimez-les plus formellement et puis testez-les si possible. Ce ne 
sont pas nécessairement des hypothèses « nulles ». 


a) Les buveurs de la bière B ne connaissent pas la différence entre les 
deux bières. 


b) Les buveurs de la bière À ne connaissent pas la différence entre les 
deux bières. 


c) Les buveurs de la bière A discriminent mieux entre les deux marques 
que les buveurs de la bière B. 


d) n'y a pas de différence discernable entre les deux bières. 
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Introduction Les méthodes du chapitre 3 sont conçues essentiellement pour 
des données qualitatives. Ces méthodes pourraient servir à l'analyse de 
données quantitatives puisqu'on peut toujours, en groupant les valeurs 
d'une variable quantitative, réduire celle-ci à une variable qualitative. On 
peut toutefois éviter la perte d'information qu'entraïînerait un tel 
regroupement en employant des méthodes propres aux variables 
quantitatives. 


Lorsque deux variables quantitatives sont dépendantes, il est possible, 
quand les circonstances sont favorables, d'exprimer la dépendance à l'aide 
d'une équation mathématique. Dans ce chapitre, nous étudions le cas 
particulier où la dépendance peut être exprimée par une équation linéaire. 
Nous commençons par montrer comment déterminer l'équation qui relie une 
variable à l'autre. Ensuite, nous définissons une mesure de la dépendance 
entre deux variables quantitatives. Finalement, nous présentons un test 
statistique permettant de déterminer si une dépendance observée dans un 
échantillon est significative ou non. 


4,1 


DROITE DES MOINDRES CARRÉS 


Typiquement, l'analyse de la dépendance entre deux variables quantitatives 
débute avec des données couplées comme celles du tableau 4.1. Ce tableau 
donne, pour un ensemble de 41 maisons vendues à Outremont au 
printemps 1981, les valeurs de deux variables : 


X : L'évaluation municipale, en milliers de dollars 
Y : Le prix à la vente, en milliers de dollars. 


Il est certain que nous allons observer une dépendance entre ces deux 
variables. La figure 4.1, qui présente les données du tableau 4.1 sous la 
forme d'un nuage de points, le confirme. Chaque maison vendue est 
représentée par un point dont l'abscisse est X, l'évaluation municipale, et 
l'ordonnée est Y, le prix à la vente. La figure montre qu'il y a une relation 
entre X et Ÿ en ce sens que, en gros, lorsque X croît, Y croît. Elle indique 
aussi que la relation est à peu près linéaire : à l'oeil, il semble possible de 
tracer une droite qui passe assez bien dans l'ensemble des points du nuage. 


Notre objectif est de trouver l'équation de la droite s'approchant le plus 
possible des points. Pour ce faire, nous allons d'abord définir une mesure de 
la « distance » entre les points et une droite ; nous allons ensuite montrer 
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comment trouver l'équation de la droite qui minimise cette distance. 


Principe des moindres carrés En général, les données prennent la forme de n 
couples (x, y) (%2, ya), .. , (Xn, Un) que l'on peut représenter par autant de 
points sur un plan cartésien. L'équation d'une droite est de la forme 


y=at+bx. 


TABLEAU 4.1 Évaluation (X) et prix (Y) de 41 maisons vendues à Outremont - printemps 1981 


X Y X Y X Y X Y 
45,3 65 136,4 235 88,8 117 29,3 58 
55,6 60 77,5 125 58,1 160 82,0 132 

102,7 140 111,2 112 98,0 188 79,0 198 
38,2 50 186,1 268 39,3 88 64,4 90 
63,6 60 69,3 150 58,8 103 78,0 110 
63,6 80 32,5 45 42,2 65 75,1 114 
41,6 74 92,3 142 45,2 77 86,8 149 
31,3 79 36,6 69 117,4 188 143,5 315 

181,4 275 87,4 100 117,3 156 85,4 130 
89,3 162 44,0 123 122,9 225 86,6 135 
54,9 136 


FIGURE 4.1 Nuage de points (données du tableau 4.1) traversé par la droite des moindres carrés calculée 
dans l'exemple 3 


(0) 50 100 150 200 


FIGURE 4.2 
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Distances verticales à une droite 
2 
ds ( (X3,Y3) 
( X3 A ) 
(X3:Y1) 
d (X55Ÿ5) 
1 CA 2 2 
A X5:5 
Ga) Ge 
*X X X3 
Soit une droite donnée y = a+ bx, et soit di, d2, .…, dn les distances verticales 


entre les points et la droite. Ces distances sont représentées par les traits 


verticaux dans la figure 4.2. 


La somme des carrés de ces distances servira de mesure globale de Ia 
distance entre les points et la droite. On définit formellement la distance D 


entre les points et la droite par 
D=d} +d; +..+d? =Xd?. 


Si l'on dénote par y, la hauteur de la droite au point x,, c'est-à-dire 


ÿ, =a+bx. 
alors d, est donné par 
= pie}, 
et D=2}y,-ÿ,| =2(v,-5,f 
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FIGURE 4.3 


Exemple 1 


Calcul de la distance verticale à une droite 


(1,8) 


: { (2,7) 
-2 
(2,5) 


(1,5) 


O = ND © À O1 OO — © © © 


Nous souhaitons que cette distance soit petite : plus elle est petite, mieux la 
droite est ajustée aux données. Puisque notre objectif est de trouver une 
droite qui s'ajuste le mieux possible aux données, nous devons chercher la 
droite pour laquelle la distance D est minimale. 


Nous commettons un léger abus de langage en utilisant le terme « distance » 
pour désigner la quantité D. En toute rigueur, nous devrions plutôt affecter 


ce terme à VD . Ces considérations d'ordre terminologique sont cependant 
sans grande conséquence puisque minimiser D ou minimiser VD revient au 
même. 

Considérons les points (1, 8), (2, 5) et (3, 10) ainsi que la droite y =3+2x 
(voir figure 4.3). 


Les trois points correspondants sur la droite ont pour ordonnée : 


D, =3+2(1)=5; ÿ, =3+2(2)=7; ÿ, =3+2(3)=09. 
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Les écarts verticaux sont : 


d, =|8-5|=3; d 


il 


[5-7|=2; d,=|10-9]=1. 


2, 
La distance D est donc : 
D=d? +d; +d; =3°+2° +1" =14. 


La droite y = 3 + 2x n'est pas la meilleure possible. Le lecteur peut vérifier 
que la droite y = 6 + x donne une distance D = 11, plus petite que la distance 
D = 14 obtenue avec y = 3 + 2x. La droite y = 6 + x passe donc mieux parmi 
les trois points que la droite y = 3 + 2x. Toutefois, elle n'est encore pas aussi 
proche que possible. On peut montrer que la droite qui minimise D est 
y= 1% + x. La distance correspondante est D = % = 10%. Aucune autre 


droite ne peut donner une distance aussi petite que celle-ci. + 
Le principe des moindres carrés est le principe selon lequel on choisit, 
parmi toutes les droites possibles, celle qui minimise la somme des carrés 


des distances verticales, c'est-à-dire, celle qui minimise la distance D. Cette 
droite est appelée droite des moindres carrés ou droite de régression. 


Droite des moindres carrés On peut démontrer que les coefficients a et b de la 


droite des moindres carrés y = a + bx sont donnés par les formules 
suivantes : 
2-2, 5) 
Ex, -xP 
a=y-bx. 


En utilisant les identités 


2x -x)v,-7)=5x;y, -(x, y, )/n 


=XXx;y;,-nxy 
(x, x) =5x? (5x, P /n 
=>x? -nx?, 


on peut trouver plusieurs expressions équivalentes pour b. En voici quelques 
unes qui sont, en général, plus faciles à employer que la formule originale 
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car elles permettent d'obtenir b en fonction des quatre sommes 2x, » Zy, 


et 2x y. 


L a cn lis 
où XV=— EX Yi x 2x". 
n n 


Exemple 2 Pour illustrer les calculs, nous prenons les données de l'exemple 1 : 


x 1 2 3 


y 8 5 10 


Des calculs simples donnent les résultats suivants : 
DE. 6 Ex? =1+4+9-14 


Zy, = 23 Ex,y,=8+10+30=48. 


i 


Donc : 


DL Yi = EX )EY:) | 8(48)- (623) _ 6 | 


nEx? -(Ex,)° 3(14)-(6)* 6 
Ze 108 6: 2026: 175 
a=y-bx = 1 = = Se 
4: AS CO 


Donc, la droite des moindres carrés est 


y=a+bx=52+x. 


Exemple 3 
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L'équation de la droite des moindres carrés est une expression qui permet 
d'estimer la valeur de Y qui correspond à une valeur de X donnée. Il suffit de 
remplacer X par la valeur en question dans l'expression y = a +bx. 


Nous utilisons les données du tableau 4.1 pour trouver l'équation qui 
permettra d'estimer le prix à la vente (Y) d'une maison d'Outremont à partir 
de son évaluation (X). Les calculs donnent : 


Ex, = 3 238,9 Zy, = 5 348 Ex? = 313 698,21 
2 

Ex;y, = 508 455,6 n=41 Zy; = 864 988 

Donc : 


EX, -XXY; -Y)=Ex,y,; -(Ex;)Zy,)/n = 85 976,643 9 
(x, - X)? =2x? — (2x, )? /n = 57 833,009 76 

D 28 976,643 9 

57 833,009 76 


= 1,486 636 166 


_  _ 5348 3 238,9 
a=y-bx 1,486 636 166 
41 41 
= 12,998 393 2 


La droite des moindres carrés est donc approximativement 
y =13+1,49x. 
Cette équation peut servir à estimer le prix de vente d'une maison à partir de 


son évaluation. Par exemple, nous estimons qu'une maison évaluée à 70 500 $ 
se vendra à : 


y =13 +1,49(70,5) = 118,045 
c'est-à-dire, 118 045 $. + 


Dans les formules pour la droite des moindres carrés, on ne peut intervertir 
les x, et les y,. Chacune des variables joue un rôle qui lui est propre. La 


variable X, appelée variable explicative (ou variable indépendante), servira 
éventuellement à estimer Y. La variable Y, appelée variable expliquée (ou 
variable dépendante), est celle dont on voudra estimer la valeur. 
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4.2 CORRÉLATION 


Il est toujours possible de déterminer la droite des moindres carrés en 
utilisant les formules de la section précédente - à condition, toutefois, que 
les x, ne soient pas tous identiques. Cela ne veut pas dire que les 


estimations faites à partir de la droite des moindres carrés seront bonnes : 
elles seront bonnes seulement dans la mesure où la relation entre X et Y est 
linéaire et forte, c'est-à-dire, dans la mesure où les points du nuage sont 
proches d'une droite de pente non nulle. 


Le coefficient de corrélation, noté 7, est une mesure de dépendance 
linéaire définie par l'une ou l'autre des formules suivantes : 


= ECX, -X)(Y, -y) 
EG -07 4/56, -7)° 
nEx;y; — (2x; X2Y;) 


Jr - (2x, ) Vrzy? - (2y,)° 


r = 


xy-xy 


p= — — 
Vx2- x? y? y" 
S 

r=—Xhb 


Y: 
Le coefficient de corrélation jouit des propriétés suivantes : 
1. -1<r< 1. Le coefficient de corrélation est toujours compris entre —-1 et 1. 


2. r= 1 siet seulement si tous les points se situent sur une droite de pente 
positive ; r = —-1 si et seulement si tous les points se situent sur une 
droite de pente négative. En d'autres termes, les valeurs extrêmes — 1 et 
1 dénotent une corrélation parfaite entre X et Y. 


3. SiXet Ÿ sont indépendantes, alors r = 0. La réciproque n'est pas vraie : 
le coefficient de corrélation peut être nul sans que les variables soient 
indépendantes. Dans ce cas, cependant, la dépendance n'est pas linéaire. 


4. r=0 siet seulement si b= 0. 


Exemple 4 
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5. Plus les points du nuage s'alignent le long d'une droite de pente non 
nulle, plus rest éloigné de O. 


Pour les données de l'exemple 3, le coefficient de corrélation est : 
nEx;y, — (Ex; )(2y;) 
rx? (2x, ) n2y? - (2y,)° 
41(508 455,6) - (3 238,9)(5 348) 


r = 


416313 698.21) - (3 238.9)? ,/41(864 988) - (5 348)° 
3 525 042,4 
V2 371153,4 /6 863 404 


= 0,87 


Le coefficient de corrélation est assez proche de 1, ce qui indique une forte 
corrélation positive entre X et Y. + 


La figure 4.4 illustre, pour différentes dispositions de points, la droite de 
régression qui s'y ajuste le mieux. Pour chaque cas on donne aussi la valeur 
approximative du coefficient de corrélation r. 


Commentaires Le graphique (a) de la figure 4.4 illustre un cas de corrélation 
négative parfaite tous les points sont exactement alignés le long d'une droite 
de pente négative : r =- 1. 


Le graphique (b) illustre une corrélation positive très forte pour laquelle 
r = 0,98. Dans le graphique (c), l'alignement des points est moins rigoureux 
mais la tendance est encore très nette : r = 0,8. Dans le graphique (d) la 
tendance linéaire est beaucoup plus faible : r = - 0,3. 


Les graphiques (e) et (f) illustrent deux cas d'indépendance. La droite de 
régression y est horizontale et r = O0. On pourrait être tenté, dans le graphique 
(}, de préférer l'ajustement d'une droite verticale plutôt que celui de la droite 
horizontale qui a été tracée. Rappelons toutefois que le critère utilisé pour 
quantifier la qualité de l'ajustement d'une droite dans un nuage de points est 
la somme des carrés des écarts verticaux entre la droite et chacun des points. 
Dans le graphique (f}, c'est vraiment la droite horizontale qui minimise la 
somme des carrés des écarts verticaux. En fait, les graphiques (e) et (f) 
illustrent fondamentalement le même cas ; il suffit de comprimer ou de dilater 
l'échelle des X on celle des Y pour passer librement de l'un à l'autre cas. Si, 
par exemple, X est mesurée en kilogrammes et Y est mesurée en dollars, le 
choix des échelles est arbitraire. 
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FIGURE 4.4 Différents cas de régression 
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Le graphique (g) donne lui exemple où la relation entre X et Y n'est pas 
linéaire. Globalement, on y observe tout de même que les petits X donnent de 
petits Y et que les grands X donnent de grands Y. Sensible à cette tendance, le 
coefficient de corrélation a pris la valeur 0,8 comme dans le graphique (0). 


Le graphique (h) montre clairement que r = O n'implique pas que les variables 
soient indépendantes. Ici, la dépendance entre X et Y est très prononcée : les 
petits X, comme les grands X, donnent de grands Y alors que les X moyens 
donnent de petits Y. 


4,3 


UN TEST D'INDÉPENDANCE 


Revenons à l'exemple des maisons d'Outremont. Dans la section 4.1, 
exemple 3, nous avons déterminé la droite de régression pour estimer le prix 
à partir de l'évaluation. Dans la section 4.2, exemple 4, nous avons 
déterminé le coefficient de corrélation pour nous assurer que la droite de 
régression donnera de bonnes estimations. Ayant trouvé un coefficient de 
corrélation de 0,87, nous avons conclu que la dépendance entre X et Y est 
assez forte pour permettre des estimations relativement bonnes. 


Cette conclusion était un peu hâtive, car le coefficient de corrélation de 0,87 
ne mesure que le dépendance qui se manifeste dans l'échantillon. Or, les 
valeurs échantillonnales sont déterminées en bonne partie par le hasard : le 
prix auquel se vend une maison est le fruit d'une négociation dont l'issue est 
imprévisible. Il se peut que deux variables soient fondamentalement 
indépendantes et que le hasard seul soit responsable de la dépendance 
observée dans l'échantillon. Dans le contexte de notre exemple, cette 
hypothèse est peu vraisemblable, d'abord parce qu'on sait a priori que le prix 
d'une maison est fortement lié à son évaluation, et ensuite parce que le 
coefficient de corrélation est élevé. Dans plusieurs cas, cependant, on ne sait 
pas a priori si les variables sont dépendantes ou non, et le coefficient de 
corrélation n'est ni très près ni très loin de O. 


Pour ces cas-là, nous avons besoin d'un test pour décider si le coefficient de 
corrélation est assez grand pour être significatif. 


Le test Le test se base sur un raisonnement analogue à celui des autres tests 
statistiques : si rest petit (en valeur absolue), on attribue la dépendance au 
hasard ; si r est grand (en valeur absolue), on attribue la dépendance 
échantillonnale à une dépendance réelle entre les variables. Il s'avère plus 
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commode, cependant, de baser le test non pas sur r lui-même mais sur une 
autre quantité, fonction de r, qui croît lorsque r croît. C'est la quantité 
définie par 


Lorsque r est grand, Z est grand et lorsque r est petit, Z est petit. De plus, 
r = 0 si et seulement si Z = 0. Donc, un test basé sur Z est équivalent à un 
test basé sur r. Toutefois, Z a l'avantage d'être une variable centrée réduite et 
peut donc être interprétée à peu près comme une cote Z. Une valeur de 3 ou 
de -3 est très éloignée de O et indique une dépendance réelle entre les 
variables. Une valeur de 1 ou de -1, par contre, n'est pas excessive : elle peut 
être due au hasard. 


Il est habituellement raisonnable de rejeter l'hypothèse d'indépendance quand 
Z se trouve à l'extérieur de l'intervalle (-2,2). Si l'hypothèse d'indépendance 
est vraie, la valeur de Z a tendance à être petite, presque certainement dans 
l'intervalle (-2,2). Auquel cas on ne rejette pas l'hypothèse d'indépendance, 
et on a raison. Il peut arriver que Z se trouve à l'extérieur de l'intervalle 
(-2,2), même si X et Y sont indépendantes. Dans ce cas, on rejette 
l'hypothèse d'indépendance à tort. La probabilité d'une telle erreur est 
voisine de 5 %, un risque généralement considéré acceptable. 


Si l'hypothèse d'indépendance est fausse, Z a tendance à sortir de l'intervalle 
(-2,2), ce qui conduit, comme il le faut, au rejet de l'hypothèse. Si Z est dans 
l'intervalle, on accepte l'hypothèse d'indépendance à tort. La probabilité 
d'accepter à tort, contrairement à rejeter à tort, ne peut pas être bornée par 
une quantité relativement petite comme 5 %. C'est pourquoi on « accepte » 
l'hypothèse avec circonspection. Il s'agit plutôt d'un non-rejet que d'une 
acceptation. 


Remarque Si n est vraiment grand, on n'a pas réellement à utiliser la 
transformation Z. En convenant de rejeter l'hypothèse d'indépendance si 
nr” >4 on arrive encore plus rapidement à la conclusion et le risque d'erreur 
est encore voisin de 5 %. 


4 Droite des moindres carrés et corrélation 123 


Dans l'exemple des maisons vendues à Outremont, la valeur de Zest 
V41-2 x0,87 
11- (0,87)? 


Pour une cote Z, cette valeur est énorme. Ceci veut dire que rest trop grand 
pour qu'on puisse attribuer la dépendance observée au hasard. La 
dépendance entre les variables est réelle. 


11,02. 


Le test basé sur nr” conduit à la même conclusion : nr” =31,03 étant 


beaucoup plus grand que le point critique 4, l'hypothèse d'indépendance est 
vigoureusement rejetée. 


Conditions de validité On peut démontrer rigoureusement la validité du test 
que nous venons de décrire si on suppose que certaines conditions (portant 
sur la distribution conditionnelle de Ÿ) sont réalisées. Or, ces conditions — 
qu'on peut énoncer de façon fort précise - n'admettent pas, en pratique, de 
vérification facile. Si l'on peut employer le test quand même, c'est parce que 
les conditions qui assurent sa validité perdent de leur importance lorsque 
l'échantillon est grand. C'est donc la seule mise en garde que nous faisons à 
propos de l'emploi de ce test : il faut que l'échantillon soit assez grand. 


Nous n'allons pas préciser le sens de « grand ». Un échantillon de taille 200 
est, à toutes fins pratiques, « grand ». Un échantillon de taille 20 est grand 
ou pas assez, selon que les conditions évoquées plus haut sont vérifiées ou 
non. Si les conditions sont vérifiées, le test est parfaitement valide ; si elles 
ne le sont qu'à peu près, le test est approximatif ; si elles ne le sont pas du 
tout, le test est en principe non valide. Dans ce dernier cas, on peut quand 
même calculer la valeur de Z, mais la conclusion qu'on en tire doit alors être 
exprimée avec circonspection. 


Remarque La notion d'indépendance a été définie formellement pour des vari- 
ables qualitatives au chapitre 3 : X et Y sont indépendantes si les distributions 
conditionnelles de Y sont identiques. La même définition s'applique aux 
variables quantitatives. Pour concrétiser, supposons que X est la taille et Y le 
poids de chaque individu d'une population d'adultes. Si x est une valeur 
donnée de X, alors x détermine une sous-population : l'ensemble de tous ceux 
pour qui X prend la valeur x. La distribution conditionnelle de Y étant donné 
X = xest la distribution de Y pour la sous-population en question. Par exemple, 
la distribution conditionnelle de Y étant donné X = 160 est la distribution du 
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poids de tous ceux dont la taille est de 160 cm I y a autant de 
sous-populations, et donc autant de distributions conditionnelles de Y, qu'il y a 
de valeurs de X. 


On dit que X et Y sont indépendantes si ces distributions conditionnelles sont 
identiques. 


RÉSUMÉ 


1. Lorsqu'un graphique indique qu'il pourrait y avoir une relation linéaire 
entre deux variables quantitatives X et Y, il convient de mesurer le degré 
de dépendance linéaire à l'aide du coefficient de corrélation r, que l'on 
peut calculer par l'une ou l'autre des formules suivantes : 


S(x,-X),-7) nx,y, (x, JET) 


han bon fe &) fe 


2. Siles données ne constituent qu'un échantillon de la population visée, on 
peut vouloir tester l'hypothèse que dans la population, les variables 
sont indépendantes. Pour effectuer ce test, on calcule 


et on rejette l'hypothèse d'indépendance si Z est trop éloigné de O0. Les 
valeurs de Z sont interprétées comme celles d'une cote Z. En général, on 
rejette l'hypothèse d'indépendance quand |7| > 2. Le risque d'erreur est 


alors voisin de 5 %. 


Si n est assez grand, ce critère de décision se ramène à rejeter 
& ‘ L ‘ 2 
l'hypothèse d'indépendance si nr° >4. 


3. La dépendance linéaire entre deux variables est exprimée par la droite 
des moindres carrés y = a + bx. C'est la droite qui minimise la somme 
des carrés des distances verticales entre les points et la droite. Les 
coefficients b et a sont donnés par : 
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2-00, 7) mx, -(x,)0p,) _ Exiy,/n= 35 
Z(x, =) n>x? - (2x, )° 2x /n-5? 


a=y—bx. 


EXERCICES 
DROITE DES 1. 
MOINDRES 
CARRÉS 
2. 
3. 
4. 
5. 


Tracez le nuage de points qui représente les données suivantes : 


x 2 3 5 7 


y 5 8 7 12 


Calculez la distance D entre le nuage de points et chacune des droites 
suivantes : 


a y=1+2x b) y=2+2x o y=3+1,1x 


Déterminez la droite des moindres carrés ; ensuite calculez la distance D 
entre les points et la droite des moindres carrés. 


Déterminez la droite des moindres carrés pour les données suivantes : 


x 1 5 8 11 
y 13 12 9 6 


Faites un graphique. 


Sans faire de calculs, déterminez la droite des moindres carrés pour les 
données suivantes : 


x 1 5 r4 9 13 
y 6 6 6 6 6 


Lorsque n = 2, quelle est la distance D entre les deux points et la droite 
des moindres carrés ? (Supposez que x, # x,.) 


Pour les données suivantes, calculez la somme X(y,-y.) et la somme 


des carrés D=X(y, -ÿ.)’. 


x 1 2 3 4 5 6 
y 6 9 10 15 16 21 
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COEFFICIENT 
DE 


CORRÉLATION 


6. 


9. 
10. 


11. 


12. 


15. 


Dans une certaine ville, un chauffeur de taxi prend note du nombre de 
kilomètres (X) et du montant perçu en dollars (Y) pour chacune des 10 
courses qu'il a faites durant la journée. Voici les données : 


x 1,5 2,6 5,4 3,8 1,5 0,7 1,8 1,9 2,7 5,1 
y 3,75 4,3 5,7 4,9 3,75 3,35 3,9 3,95 4,35 5,55 


a) Tracez un nuage de points. 

b) Déterminez la droite des moindres carrés. 

c) Interprétez les coefficients a et b. 

Si, dans les formules pour a et b on échangeait X et Y, est-ce qu'on 


obtiendrait la même droite ? Vérifiez votre réponse à l'aide des données 
de l'exercice 1. 


On prend note du score X dans un test d'aptitude et de la note Y en 
mathématiques de 10 étudiants. Voici les résultats : 


x 11 13 14 15 16 17 19 20 23 25 
2 5 6 7 9 11 16 17 16 18 19 
La droite de régression est y = — 7,10 + 1,13x. Estimez la note en 


mathématiques d'un étudiant dont le score est 5. Pouvez-vous réconcilier 
votre résultat avec le bon sens ? 


Calculez le coefficient de corrélation pour les données de l'exercice 2. 


Que peut-on dire de la valeur d'un coefficient de corrélation calculé à 
partir de 2 couples seulement ? 


À partir du nuage de points de l'exercice 6, donnez la valeur du 
coefficient de corrélation. 


Faites le graphique et calculez le coefficient de corrélation pour les 
données suivantes : 


y 22 18 14 10 6 2 6 10 14 18 22 


D'après le graphique, les variables sont-elles indépendantes ? 


Si l'on fait subir une transformation linéaire à chacune des variables X et 
Y, le coefficient de corrélation ne change pas en valeur absolue. Vérifiez 
cette affirmation à l'aide des données de l'exercice 2 en calculant le 
coefficient de corrélation entre 2 + 4x et 30 + 2y. Calculez également le 
coefficient de corrélation entre 2 + 4x et 30 — 2y. 
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14. En examinant les formules pour le coefficient de corrélation, dites sir 
change lorsque X et Y sont permutés. 


TEST 15. Considérez une population de 9 éléments dont les valeurs de X et Y sont : 
D'INDEPENDANCE 
(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3) 
On peut considérer cette population comme formée de 3 sous- 
populations celle pour laquelle x = 1, celle pour laquelle x = 2, et celle 
pour laquelle x = 3. Supposons qu'on prélève de cette population un 
échantillon de taille 3 en choisissant au hasard un individu dans chaque 
sous-population, et qu'on calcule le coefficient de corrélation 
échantillonnal r. Montrez, en choisissant des échantillons appropriés, 
que r peut être égal à —-1, à O, ou à 1. Trouvez aussi un échantillon pour 
lequel r prend une valeur différente de celles-ci. (Suggestion : faites un 
graphique.) Quel est le coefficient de corrélation de la population ? 


16. Avec un échantillon de taille 30, peut-on déclarer que les variables sont 
réellement dépendantes ? 


a) Sir=0,l b) Sir=0,2 c) Sir=0,3 
d) Sir=0,4 e) Sir=-0,2 f) Sir=-0,5 


17. Supposons que dans un échantillon de taille n on obtient r = 0,4. Peut-on 
déclarer que les variables sont réellement dépendantes ? 


a) Sin=5 b) Sin=15 c) Si n = 20 d) Sin=30 
DIVERS 18. Un sondage est fait auprès des pères de 17 élèves d'une école. De 


chacun on obtient l'information suivante : le nombre d'années de 
scolarité, et le nombre de revues ou livres lus en un mois. Voici les 


données : 
Scolarité Nombre de revues ou de livres Scolarité Nombre de revues ou de livres 
10 2 17 6 
10 18 


_ 
[Ce] 

= © BB —J © O1 = 
= 
EN 

O O1 À O1 O1 oO oO 
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a) Laquelle des variables est la variable indépendante naturelle ? 
b) Faites le graphique et calculez le coefficient de corrélation. 
c) Déterminez la droite des moindres carrés. 


d) Testez l'hypothèse que le nombre de revues et de livres lus n'a pas de 
rapport avec la scolarité. 


19. Voici les données de l'A.P.A. sur la cylindrée (X) et la consommation 
d'essence (Y) de 25 modèles de voitures. La cylindrée est exprimée en 
litres, la consommation en litres par 100 km. 


Modèle X Y Modèle X Y 
Mazda GLC 1,5 8,0 Pontiac 6000 2,8 11,0 
Tercel 1,5 8,0 Pontiac Phoenix 2,8 11,5 
Honcla Civic 1,5 8,0 Cougar 3,3 12,0 
Datsun 310 1,5 9,3 BMW 733i 3,3 14,0 
Datsun Nissan 2 9,5 Thunderbird 3,3 12,5 
Fiat 2000 2 11,0 Impala 3,8 12,4 
Mazda 626 2 11,0 M. Benz 380SL 3,8 13,7 
Saab 900 2 11,5 Granacla 3,8 13,0 
Skylark 2,5 10,3 Olds Delta 88 3,8 13,0 
Celebrity 2,5 10,5 Mustang 5 14,5 
Camaro 2,5 10,4 Lincoln 5 14,0 
Toyota Sup. 2,8 12,8 Olds 98 5 14,8 
Datsun 280ZX 2,8 12,0 


a) Faites le graphique et calculez le coefficient de corrélation. 
b) Déterminez la droite des moindres carrés. 


c) Estimez la consommation d'essence d'une voiture dont le moteur est 
de 4 litres. 


Ex = 72,8; Ey = 288,7: Xx° = 240,54: Xp? = 3 420,57; Xxy = 887,92. 


20. Le tableau suivant donne, pour 15 trimestres consécutifs, les valeurs des 
deux variables suivantes : 


X: L'indice d'offre d'emploi (1969 = 100). Il s'agit d'un indice calculé 
à partir des offres d'emploi parues dans les 18 plus grands 
journaux canadiens. 


Y : Le taux de chômage. 


21. 


22. 
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Année Trimestre X Y Année Trimestre X Y 

1978 1 159 8,40 1980 1 204 7,50 
2 154 8,50 2 195 7,70 
3 161 8,40 3 204 7,50 
4 187 8,16 4 210 7,40 

1979 1 175 7,96 1981 1 231 7,30 
2 186 7,70 2 221 7,15 
3 198 7,13 3 241 7,13 
4 196 7,23 


a) Faites le graphique et calculez le coefficient de corrélation. 
b) Déterminez la droite des moindres carrés. 
Zx = 2922; Zy=115,16; Xx° = 578 368; Xp” = 887,516 4; Xxy = 22 277,22. 


Le tableau suivant donne, pour les fils de cuivre, le diamètre en cm (X) et 
l'ampérage maximal toléré (Y). 


X Y X Y 
1,30 245 2,08 530 
1,40 285 2,21 575 
1,52 330 2,41 660 
1,65 385 2,79 740 
1,85 425 3,05 845 
1,98 480 3,45 1 000 


a) Faites le graphique et calculez le coefficient de corrélation. 
b) Déterminez la droite des moindres carrés. 
c) Estimez l'ampérage maximal toléré par un fil de diamètre 2,50. 


Les données suivantes, provenant du ministère de l'Agriculture, des 
Pêcheries et de l'Alimentation, portent sur une expérience visant à 
déterminer la relation entre le taux de semis d'avoine (X, en kg/ha) et le 
nombre de plantules par mètre carré (Y). Les données portent sur 17 
parcelles de terre. 


X Y X Y X Y 

90 232 105 237 114 201 
95 208 106 298 120 304 
95 220 108 279 120 275 
95 150 113 237 126 284 
95 203 113 210 133 313 


100 252 114 211 
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23. 


24. 


a) Faites un graphique et calculez le coefficient de corrélation. 
b) Déterminez la droite des moindres carrés. 


c) Estimez le nombre de plantules auquel on peut s'attendre lorsqu'on 
sème à un taux de 118 kg/ha. 


d) Pourquoi la relation ne peut-elle être linéaire que pour un intervalle 
restreint de valeurs de X ? 


2x =1842; Zy=4114; Xx°? = 202 020; Xp? = 1027 372; Exy = 451 252. 


Dans un échantillon de 18 personnes, on prend note du poids (X, en kg) 
et du taux de cholestérol (Y, en mg par 100 mil de sang). Voici les 
données 


X Y X Y X Y 

50 262 72 281 93 277 
56 250 76 293 94 300 
58 265 78 271 95 305 
64 280 82 261 101 310 
64 264 82 296 104 286 
68 256 86 268 108 301 


a) Faites un graphique et calculez le coefficient de corrélation. 
b) Déterminez la droite des moindres carrés. 


c) Testez l'hypothèse selon laquelle le taux de cholestérol et le poids 
sont indépendants. 


2x =1431; Zy= 5026: Xx° =118 895: Zy° =1 409 064: Xxy = 403 552. 


Au service du personnel d'une compagnie d'assurances, un analyste 
tente de savoir quels sont les facteurs qui déterminent le succès des 
vendeurs. L'une des hypothèses est que l'aptitude verbale représente un 
facteur important, et pour l'éprouver il prélève un échantillon de 30 
vendeurs à qui il fait passer un test d'aptitude verbale. Les tableaux 
suivants donnent le score (X) pour les 30 vendeurs, ainsi que leurs 
ventes annuelles (Y) en dizaines de milliers de dollars. 
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X Y X Y X Y 

22 30 41 180 80 320 
24 20 48 100 65 350 
29 50 43 140 82 280 
33 40 46 120 90 400 
25 80 56 160 60 400 
31 50 44 160 70 320 
35 80 57 140 85 350 
38 30 59 180 68 280 
27 40 52 100 73 300 
36 20 54 120 77 300 


a) Calculez le coefficient de corrélation et testez l'hypothèse selon 
laquelle X et Y sont indépendantes. 


b) Supposons que vous appreniez qu'avant de tirer l'échantillon, 
l'analyste a séparé les vendeurs de la compagnie en trois groupes, le 
premier comprenant les vendeurs de moins de 5 années d'expérience ; 
le deuxième les vendeurs ayant de 5 à 10 années d'expérience ; et le 
troisième, enfin, les vendeurs ayant plus de 10 années d'expérience. Il 
a ensuite prélevé un échantillon de 10 vendeurs dans chaque groupe. 
Supposons que les trois colonnes du tableau ci-dessus correspondent 
au premier, au deuxième et au troisième groupe, respectivement. 
Analysez, à la lumière de ces faits, la relation entre le score d'aptitude 
verbale et les ventes. Expliquez la contradiction entre cette conclusion 
et celle que vous avez tirée en a). 


Premier groupe 


Ex = 300; Zy = 440; Xx° =9 270; Zy° = 23 600; Exy = 13 200 


Deuxième groupe 


2x = 500: Zy =1 400: x? = 25 372: Xp? = 204 00: Xxy = 70 000 


Troisième groupe 


Ex = 750; Zy = 3 300: 2x? = 57 056; Zy°? = 1106 600; Xxy = 247 500 


25. Dans un collège, certains étudiants suivent un cours de rattrapage en 
mathématique pour se préparer au cours de calcul. Pour évaluer l'utilité 
du cours, on prélève un échantillon d'étudiants ayant suivi le cours de 
rattrapage, et un échantillon d'étudiants ne l'ayant pas suivi. Après qu'ils 
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aient tous suivi le cours de calcul on observe leurs notes (Y). On constate 
que ceux qui ont suivi le cours de rattrapage (le groupe A, disons) ont 
une moyenne inférieure à celle de ceux qui ne l'ont pas suivi (le groupe 
B) : 58,8 pour le groupe A et 68,2 pour le groupe B. Dans d'autres 
circonstances, ces résultats auraient mené à l'étonnante conclusion que 
le cours de rattrapage a eu un effet négatif. Dans ce cas, les étudiants 
qui ont suivi le cours étaient faibles au départ — c'est précisément la 
raison pour laquelle ils l'ont suivi. Leur faible note en calcul ne démontre 
donc pas que le cours leur a été inutile ou nuisible. Pour étudier la 
question plus à fond, on prélève des données sur la note en 
mathématiques (X) obtenues à la dernière année du secondaire. Voici les 
données sur X et sur Ÿ pour les deux groupes. 


Groupe A Groupe B 
X Y X Y 
50 57 70 60 
51 46 71 53 
52 59 74 64 
53 58 77 66 
54 52 78 64 
55 51 81 66 
56 65 83 76 
57 62 83 75 
60 61 87 75 
68 77 91 83 


Ces données permettent-elles de tirer des conclusions sur l'utilité du 
cours de rattrapage ? (Ne vous préoccupez pas des problèmes 
d'échantillonnage : supposez que tous les coefficients que vous calculez 
sont de bonnes estimations des coefficients correspondants dans la 
population.) (Suggestion : faites un graphique.) 


Groupe A 
Ex = 556; Zy = 588; Xx° = 31164; Zy° = 35 234; Xxy = 33 021 
Groupe B 
Zx = 795; Xy = 682; Xx° = 63 619; Zy° = 47 228; Xxy = 54 730 
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26. Pour un échantillon de 15 familles de 4 personnes on prélève des 


27. 


données sur 2 variables : 
X : Le revenu hebdomadaire net. 
Y : Les dépenses en nourriture. 


Voici les données : 


X Y X Y X Y 
150 80 225 88 290 88 
175 60 230 89 320 90 
210 85 250 81 370 89 
220 70 260 86 380 92 
220 79 275 86 500 95 


a) Calculez le coefficient de corrélation. 


b) Déterminez la droite des moindres carrés et interprétez les valeurs de 
a et de b. 


c) Estimez les dépenses en nourriture d'une famille dont le revenu 
hebdomadaire net est de (i) 150 $ ; (ïi) 500 $. 


d) Une façon classique d'exploiter le lien entre deux variables est basée 
sur le rapport de la somme des Y à la somme des X. Ce rapport ici 
vaut XZy/Ex=1258/4075=0,309, ce qui veut dire qu'en moyenne 
30,9 % du revenu est dépensé en nourriture. En appliquant ce 
pourcentage au revenu d'une famille on obtient une estimation de ses 
dépenses en nourriture. Employez cette méthode pour faire les 
estimations demandées en (c). Quels sont les inconvénients de cette 
approche ? 


e) Croyez-vous que la droite des moindres carrés puisse fournir de 
bonnes estimations des dépenses pour les familles avec un revenu 
hebdomadaire de 5 000 $ ? 


f) Faites un test pour déterminer si les variables X et Y sont réellement 
dépendantes. 


2x =4075; Zy=1258; x? =1221075; Zy° =106 638: Xxy = 349 370. 


Une façon d'étudier les déterminants génétiques d'un trait humain 
consiste à mesurer ce trait sur des jumeaux qui ont vécu séparés. Dans 
une telle étude, 36 paires de jumeaux ayant été séparés très jeunes 
passent un test d'aptitudes. On obtient les scores qui paraissent au 
tableau voisin. 
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28. 


*29. 


X = score du premier jumeau, Y = score du second. 
n=36; 2x =887; Xy= 828; Xx° = 24381; Xy° = 21 746; Xxy = 22 509. 


Déterminez le coefficient de corrélation r entre les aptitudes du premier 
et du second jumeau. La corrélation est-elle significative ? Discutez. 


Pour tenir compte de certaines caractéristiques d'un contexte on peut 
vouloir poser d'emblée l'égalité a = O, pour ne considérer que le modèle 
y = bx. Dans ce cas, pour calculer b, il suffit de remplacer x et y par O 


dans la formule pour b donnée dans ce chapitre. On a alors 


b=Xx;y, e D . Utilisez cette formule pour déterminer le coefficient b dans 


le problème précédent. 


Paire Premier Second Paire Premier Second Paire Premier Second 


1 5 3 13 21 16 25 31 23 
2 8 6 14 23 29 26 30 29 
3 15 12 15 23 20 27 31 33 
4 13 14 16 25 31 28 32 27 
5 14 5 17 25 19 29 32 31 
6 12 24 18 26 26 30 30 19 
7 14 7 19 26 23 31 32 27 
8 15 23 20 27 25 32 36 27 
9 21 12 21 26 25 33 36 31 
10 18 22 22 28 23 34 33 25 
11 22 25 23 28 32 35 37 36 
12 23 28 24 29 32 36 40 38 


Certaines associations ne peuvent pas être représentées par une 
équation linéaire. La concentration d'un médicament dans le sang, par 
exemple, ne diminue pas de façon linéaire après son absorption, car le 
taux d'élimination du produit est proportionnel à la quantité présente 
dans le sang. Certains arguments théoriques rendent plausible 
l'hypothèse que la concentration y est liée à la durée x depuis 
l'absorption par une équation de la forme 


y=ae 


Le problème est encore de trouver a et b à partir du tableau ci-dessous, 
qui présente des données sur la concentration y du médicament dans le 
sang à différents moments (x. Les méthodes de ce chapitre peuvent être 
utilisées, à condition de transformer la variable Y en une variable Ÿ' qui, 
elle, est linéaire en X. C'est la transformation logarithmique qui a cet 


*30. 
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effet. Par l'équation exponentielle ci-dessus, nous avons log y = log a - 
bx. Donc la variable Y'= log Y s'exprime comme fonction linéaire 


y'=a"+b'x 
où a = log aet b'=-b. 

X Y X Y X Y 
Nombre Concentration Nombre Concentration Nombre Concentration 
d'heures (mg/ml) d'heures (mg/ml) d'heures (mg/ml) 

0,5 0,091 6 3,5 0,052 3 6,5 0,025 5 

1,0 0,089 8 4,0 0,031 7 7,0 0,023 5 

1,5 0,080 5 4,5 0,038 4 7,5 0,023 1 

2,0 0,059 0 5,0 0,037 6 8,0 0,019 6 

2,5 0,057 8 5,5 0,030 8 8,5 0,016 7 

3,0 0,053 4 6,0 0,029 3 9,0 0,016 6 


Le tableau donne les concentrations prélevées à chaque demi-heure 
pendant 9 heures après la consommation. 


a) 


b) 


Construisez un nuage de points pour montrer que la relation entre X 
et Y n'est pas linéaire. 


Déterminez a'et b', les coefficients de la droite de régression entre Y' 
et X. 


Déterminez les paramètres a et b de l'équation exponentielle 


bx 


y=ae 


Utilisez l'équation pour estimer la concentration 2 heures et 15 
minutes après la consommation. 


n=18; 2x, =85,5; 2x? =527,25; Xx, log y, =-30 598; 


Slog y, =-59195; xflog y, | =199 908. 


Cet exercice montre une façon de quantifier la distribution des 
ressources dans une population, comme les terres arables, le capital, le 
revenu. Considérons la proportion X de la population qui est la plus 
démunie et notons par Y la proportion des ressources que cette partie de 
la population possède. Avec des statistiques, on peut obtenir pour une 
série de valeurs de X une valeur de Ÿ correspondante. La forme de la 
courbe reliant X à Ÿ renseigne sur le degré d'inégalité de la distribution. 
L'égalité parfaite se traduit par la droite y = x qui passe de (0, O) à (1, 1). 
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*31. 


En général, la courbe se situe au-dessous de la droite, rejoignant 
cependant les points (0, O) et (1, 1), et passe très bas au-dessous de la 
droite dans des situations de profondes inégalités. Un modèle possible 
pour cette courbe est l'équation 


Y—X 


où b est un paramètre qui doit être estimé. Une égalité est alors mesurée 
par la valeur de b, qui est toujours supérieure ou égale à 1. Le tableau 
suivant donne la valeur de y pour certaines valeurs de x. 


X Y X Y X Y 
0,25 0,032 0,50 0,180 0,75 0,588 
0,30 0,055 0,55 0,259 0,80 0,618 
0,35 0,079 0,60 0,275 0,85 0,650 
0,40 0,115 0,65 0,367 0,90 0,843 
0,45 0,173 0,70 0,453 0,95 0,860 


n=15; Xlog x, =-8774; xflogx, | =7535; Xlog y, =-20 714: 
>[log y, |? = 43 274: Xlog xlog y, =18 037. 


Pour déterminer la valeur de b, on peut faire les transformations 
y'= log{y), x'= log(x. On a alors la relation 


y'= bx' 


où b peut être estimé en utilisant la formule proposée à l'exercice 28. 
Déterminez b. 


Une conseillère pédagogique reçoit les données suivantes sur 15 classes 
de mathématique sous sa juridiction. Son but est de déterminer si un 
certain jeu qu'elle a conçu améliore l'apprentissage des mathématiques. 
La variable X représente le nombre d'heures passées pendant l'année à 
jouer au jeu ; et Ÿ est la note moyenne de la classe à un examen de 
mathématique. Remarquez que chaque y, est une moyenne d'un nombre 


variable de notes. Par conséquent, les formules pour calculer a et b 
changent. Nous pouvons toujours les écrire sous la forme suivante : 


b= (xy 5)/ 6° _-x°) et a=y-bx; mais les moyennes impliquées 
doivent être pondérées : par exemple, xy =En,x,y, /n et x° = Zn x° /n. 


Calculez a et b pour les données suivantes. 


32. 


*33. 
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Effectif X Y Effectif X Y Effectif X Y 
22 2 70 31 4 66 36 6 63 
28 8 68 27 10 74 30 12 76 
33 14 80 37 16 71 41 18 89 
20 20 86 19 22 69 28 24 81 
27 26 85 32 28 90 25 30 92 


Un spécialiste développe un test dans le but d'établir une relation entre 
la dextérité manuelle et l'aptitude mentale des élèves du secondaire. À 
l'occasion d'une analyse préliminaire il fait passer des tests à 25 élèves, 
obtenant pour chacun le score (X) à un test d'aptitude et le score (Y) à un 
test de dextérité manuelle. Pour s'assurer d'une bonne représentation, il 
choisit un groupe de chaque niveau du secondaire. Il obtient les résultats 
suivants : 


Secondaire 1 Secondaire 2 Secondaire 3 Secondaire 4 Secondaire 5 
X Y X Y X Y X Y X Y 
26 25 42 37 56 43 68 54 80 61 
28 29 43 35 57 47 69 56 82 66 
32 27 44 34 59 45 72 55 84 63 
36 25 46 35 61 46 73 53 87 62 
38 27 49 39 62 44 75 55 92 63 
b —0,04 0,39 0,04 —0,07 —0,01 
a 27,8 18,5 42,7 59,3 64,0 
r —0,12 0,54 0,06 —0,17 —0,03 
Z —0,20 1,11 0,11 —0,29 —0,05 


Pour le groupe au complet : 
2x =1461; Zy=1126; Zx° 94457; Xy° = 54950 ; Zxy = 71 868. 


Selon les résultats ci-dessus, il n'y a rien de significatif. Vérifiez que 
néanmoins, le coefficient de corrélation obtenu en réunissant les 25 
données est 0,98, fortement significatif. Dessinez un nuage de points 
dans lequel vous représenterez chaque classe par un symbole différent 
et, à partir de ce dessin, interprétez la contradiction entre les conclusions 
basées sur chaque classe et celle basée sur l'ensemble des classes. 
Tâchez d'éviter le langage technique dans vos explications. 


Une faculté universitaire considère la possibilité d'imposer un test 
d'admission. Elle fait passer le test à un ensemble de 46 étudiants déjà 
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*34. 


inscrits, et calcule le coefficient de corrélation entre le résultat (X) et la 
moyenne obtenue au premier trimestre (YŸ). Voici les résultats : 


X Y X Y X Y X Y X Y 
5 24 25 42 39 52 47 65 57 90 
10 35 27 60 39 70 48 81 57 70 
12 29 29 44 41 72 49 73 58 85 
12 37 30 52 41 67 49 69 59 86 
13 38 32 57 42 61 51 75 59 92 
15 29 35 56 43 75 52 87 60 95 
18 35 36 60 45 72 52 70 60 80 
19 44 36 67 45 79 53 85 61 90 
21 38 38 56 46 67 56 90 62 85 
23 50 


Le coefficient de corrélation, qui est ici 0,95, encourage l'administration 
de l'université à utiliser le test à l'avenir. Cette information aurait été 
perdue en grande partie si l'on avait procédé immédiatement à 
l'utilisation du test. Supposons, par exemple, que l'université ait refusé 
l'admission à tous les candidats qui n'avaient pas obtenu un score de 50 
ou plus. Il lui resterait pour son expérience les 14 sujets admis. Le 
coefficient de corrélation pour ceux-ci n'est que 0,46. Faites un nuage de 
points montrant les 46 sujets, puis indiquez ceux qui seraient admis 
avec ce critère. Expliquez par un argument graphique pourquoi le 
coefficient de corrélation baïsse tellement. 


On étudie l'effet de la scolarité sur la tendance à être libéral sur des 
questions économiques. On prélève des sujets appartenant à trois 
classes sociales, À, B et C ; À représente la classe ouvrière, B la petite 
bourgeoisie, C la classe dirigeante. On recueille les données suivantes, 
où X est le nombre d'années de scolarité et Y est le score dans un test de 
libéralisme. 


Pour le groupe au complet : 
Ex = 404; Zy=1084; 3x° =6138; Zy° =45656; Xxy=14 533. 


Pour chaque groupe, la relation entre la scolarité et le « libéralisme » est 
forte et significative. Vérifiez, cependant, que lorsqu'on réunit les trois 
groupes on obtient un coefficient de corrélation de -0,03, ce qui est 
parfaitement non significatif. Dessinez un nuage de points dans lequel 
vous représenterez chaque classe par un symbole différent. À partir de ce 
dessin, interprétez la contradiction entre les conclusions basées sur 
chaque groupe et celle basée sur l'ensemble des groupes. Tâchez d'éviter 
le langage technique dans vos explications. 


4 Droite des moindres carrés et corrélation 139 


Classe A Classe B Classe C 

X Y X Y X Y 
5 25 11 20 16 15 
6 30 12 20 17 20 
6 30 13 20 18 25 
7 20 14 25 19 35 
8 50 15 55 20 45 
8 55 16 40 21 55 
10 65 17 55 18 35 
10 60 17 59 18 25 
7 40 14 30 19 25 
8 45 15 40 19 20 

b 8,37 6,91 7,30 

a —20,8 —63,1 —105,0 

r 0,89 0,89 0,84 

Z 5,56 5,44 4,36 


*35. Dans le tableau 4.2 nous présentons des données prélevées en 1977 sur 
les salaires au moment de l'engagement de 93 employés, dont 32 sont de 
sexe masculin et 61 de sexe féminin’. Les salaires sont ceux auxquels les 
employés ont été engagés ; l'expérience est le nombre de mois 
d'expérience préalable dans un domaine connexe ; la période est la date 
d'engagement, exprimée en nombre de mois depuis le ler janvier 1969. 
Voici les moyennes des différentes variables pour les hommes et pour les 


femmes. 
Femmes Hommes Tous 
Salaires (1 000 $) 5,139 5,957 5,420 
Éducation 11,97 13,53 12,51 
Expérience 99,81 103,05 100,93 
Période 17,44 15,34 16,72 


On a prélevé ces données dans le but de déterminer s'il y a eu 
discrimination dans les engagements. À première vue, les moyennes 
salariales pourraient appuyer l'hypothèse d'une discrimination, mais on 
constate que les femmes ont moins de scolarité et moins d'expérience 
que les hommes et ces différences pourraient expliquer les différences 
salariales. D'autre part, les femmes ont été engagées en moyenne plus 
tard que les hommes, ce qui devrait avoir pour conséquence d'augmenter 


* Roberts, H.V. (1979), Harris Trust and Savings Bank : An analysis of employee compensation, Report 7946, 
Center for Mathematical Studies in Business and Economics, University of Chicago, Graduate School of Business. 
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leur salaire et non de les diminuer. Il est évident que toute comparaison 
de salaires devrait être faite à partir de moyennes ajustées. Dans cet 
exercice on vous demande de calculer des moyennes salariales ajustées. 


a) 


Vérifiez que la droite de régression du salaire (Ÿ) sur la scolarité (X) et 
le coefficient de corrélation sont 


pour les femmes, Y = 4,382 + 0,063X, r = 0,27 
pour les hommes, Y =4,120 + 0,136X, r = 0,37 


et que la dépendance est significative dans les deux cas. Calculez la 
valeur de Ÿ qui correspond à X = 12,51, pour les hommes et pour les 
femmes. Les valeurs obtenues sont des moyennes ajustées. Le 
concept est identique à celui présenté au chapitre 2, mais la 
technique change du fait que la variable pour laquelle on ajuste est 
quantitative. Interprétez les résultats. 


On fait des opérations analogues pour obtenir des moyennes 
salariales ajustées qui tiennent compte de la différence de période. 
Vérifiez que la droite de régression du salaire (Y) sur la période 
d'engagement (X) et le coefficient de corrélation sont 


pour les femmes, Y = 4,752 + 0,022X, r = 0,43 
pour les hommes, Y = 5,550 + 0,027X, r = 0,37 


Vérifiez que la dépendance est significative dans les deux cas et 
calculez des moyennes ajustées. Commentez. 


Vérifiez que la droite de régression du salaire (Ÿ) sur l'expérience (X) 
et le coefficient de corrélation sont 


pour les femmes, Y = 4,927 + 0,002 1X, r = 0,34 
pour les hommes, Y = 5,964 — 0,000 1X, r=-0,01 


Vous constatez que la dépendance n'est pas significative pour les 
hommes, ce qui pose un dilemme. À moins d'attribuer ce qu'on 
observe ici à un accident du hasard, nous devons expliquer le fait 
que le salaire dépend de l'expérience pour les hommes maïs pas pour 
les femmes. Cette question ne peut être tranchée ici, mais le lecteur 
pourrait trouver instructif de se livrer à ses propres spéculations. 
Autre problème : comment ajuster les données ? S'il est certain que Y 
ne dépend pas de X, alors ajuster n'a pas de sens. D'autre part, cette 
conclusion n'est jamais vraiment certaine. Il est donc raisonnable de 


TABLEAU 4.2 
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procéder comme aux deux numéros précédents, d'autant plus que 
l'ajustement se révèle presque sans effet. Vous pouvez confirmer ceci 
en calculant les moyennes ajustées pour les femmes et pour les 
hommes. 


Salaire initial, scolarité, expérience et date d'engagement de 61 femmes 


Femmes 


Salaire Scolarité Expérience Période 


Salaire Scolarité Expérience Période 


(mille $) (années) (mois) (mois) (mille $) (années) (mois) (mois) 
3,99 12 0,0 1 1 5,22 12 127,0 29 
4,02 10 44,0 7 E 5,28 8 90,0 11 
4,29 12 5,0 30 5,28 8 190,0 1 
4,38 8 6,2 7 l 5,28 12 107,0 11 
4,38 8 7,5 6 E 5,40 8 173,0 34 
4,38 12 0,0 7 5,40 8 228,0 33 
4,38 12 0,0 10 i 5,40 12 26,0 11 
4,38 12 4,5 6 5,40 12 26,0 33 
4,44 15 75,0 2 i 5,40 12 38,0 22 
4,50 8 52,0 3 i 5,40 12 82,0 29 
4,50 12 8,0 19 E 5,40 12 169,0 27 
4,62 12 52,0 3 5,40 12 244,0 1 
4,80 8 70,0 20 ! 5,40 15 24,0 13 
4,80 12 6,0 23 | 5,40 15 49,0 27 
4,80 12 11,0 12 i 5,40 15 51,0 21 
4,80 12 11,0 17 ! 5,40 15 122,0 33 
4,80 12 63,0 22 E 5,52 12 97,0 17 
4,80 12 144,0 24 5,52 12 196,0 32 
4,80 12 163,0 12 1! 5,58 12 132,5 30 
4,80 12 228,0 26 E 5,64 12 55,0 9 
4,80 12 381,0 1 5,70 12 90,0 23 
4,80 16 214,0 15 ! 5,70 12 116,5 25 
4,89 8 318,0 25 E 5,70 15 51,0 17 
5,10 8 96,0 33 5,70 15 61,0 11 
5,10 12 36,0 15 ! 5,70 15 241,0 34 
5,10 12 59,0 14 E 6,00 12 121,0 30 
5,10 15 115,0 1 6,00 15 78,5 13 
5,10 15 165,0 4 1 6,12 12 208,5 21 
5,10 16 123,0 12 6,30 12 86,5 33 
5,16 12 18,0 12 i 6,30 15 231,0 15 


5,22 


8 102,0 29 
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TABLEAU 4.2 


Salaire initial, scolarité, expérience et date d'engagement de 32 hommes 


Hommes 
Salaire Scolarité Expérience Période Salaire Scolarité Expérience Période 
(mille $) (années) (mois) (mois) (mille $) (années) (mois) (mois) 
4,62 12 11,5 22 6,00 12 252,0 11 
5,04 15 14,0 3 6,00 12 272,0 19 
5,10 12 180,0 15 6,00 15 25,0 13 
5,10 12 315,0 2 i 6,00 15 35,5 32 
5,22 12 29,0 14 E 6,00 15 56,0 12 
5,40 12 7,0 21 6,00 15 64,0 33 
5,40 12 38,0 11 i 6,00 15 108,0 16 
5,40 12 113,0 3 6,00 16 45,5 3 
5,40 15 17,5 8 6,30 15 72,0 17 
5,40 15 359,0 11 i 6,60 15 64,0 16 
5,70 15 36,0 5 6,60 15 84,0 33 
6,00 8 320,0 21 6,60 15 215,5 16 
6,00 12 24,0 2 ! 6,84 15 41,5 7 
6,00 12 32,0 17 6,90 12 175,0 10 
6,00 12 49,0 8 6,90 15 132,0 24 
6,00 12 56,0 33 i 8,10 16 54,5 33 
d) Revenons aux deux droites de régression en a). Nous avons trouvé 


que pour X = 12,51 le salaire moyen des femmes est inférieur à celui 
des hommes. Toutefois les deux droites de régression ne sont pas 
parallèles et elles se rencontreront pour une certaine valeur de X ; et 
au-dessous de ce point, ce sont les femmes qui ont le plus gros 
salaire. Pour quelle valeur de X les deux droites se rencontrent-elles ? 
La conclusion déterminée en a) change-t-elle ? Pourquoi ou pourquoi 
pas ? 

Les techniques utilisées ici ne sont malheureusement pas adéquates, 
puisqu'elles ne permettent pas de réconcilier les conclusions en a) et 
en b). On devrait pouvoir ajuster les moyennes pour tenir compte 
simultanément de la différence de scolarité et de la différence de 
période. Il existe une généralisation des concepts présentés dans ce 
chapitre qui permet d'exprimer la dépendance entre le salaire (Ÿ) et 
plusieurs autres variables. Une régression utilisant plusieurs 
variables porte le nom de régression multiple. En particulier, nous 
pouvons exprimer la dépendance entre le salaire (Ÿ), d'une part, et la 
scolarité (X1) et la période (X2), d'autre part. Les équations pour les 
femmes et les hommes sont : 

pour les femmes, Y = 3,882 8 + 0,071 OX: + 0,023 3X2 
pour les hommes, Y = 3,885 8 + 0,125 2 X1 + 0,024 6X 


Déterminez les moyennes ajustées et commentez. 
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Introduction Nous avons vu, dans les premiers chapitres, comment présenter 
des données quantitatives tirées d'une population et comment en extraire 
certaines caractéristiques. Nous avons vu aussi que dans la plupart des cas, 
une étude statistique se restreint à la considération d'un échantillon et à 
l'établissement des conditions mathématiques selon lesquelles les 
conclusions tirées de l'examen de l'échantillon peuvent s'étendre à la 
population entière. Une telle démarche suppose l'usage d'un certain nombre 
d'outils mathématiques, et en particulier de ceux qui régissent l'étude des 
phénomènes aléatoires et des probabilités. 


On peut prévoir le moment exact d'une éclipse de soleil, on peut aussi 
déterminer à l'avance la trajectoire d'un projectile si l'on connaît les 
conditions de son envol. De tels phénomènes sont déterministes. De 
nombreux autres phénomènes par contre sont aléatoires”, c'est-à-dire qu'on 
ne peut pas en prévoir l'issue. Ainsi en est-il des jeux de hasard, comme du 
nombre de naissances qui surviendront l'an prochain dans une clinique 
donnée d'obstétrique. C'est cette dernière catégorie de phénomènes qu'étudie 
la statistique. 


Nous nous intéresserons donc dans ce chapitre aux expériences aléatoires, 
c'est-à-dire à toute opération dont on peut décrire, ou énumérer, l'ensemble 
des résultats possibles, mais dont on ne peut prévoir lequel arrivera. Cela 
nous amènera naturellement à définir les probabilités et à en étudier les lois 
élémentaires, ainsi que les variables aléatoires, c'est-à-dire les quantités 
dont la variation est soumise au hasard. 


5.1 


Exemple 1 


Exemple 2 


ESPACE ÉCHANTILLON ET ÉVÉNEMENT 


Espace échantillon Pour décrire le comportement du résultat d'une 
expérience aléatoire, il faut d'abord déterminer l'ensemble de tous les 
résultats possibles. Cet ensemble porte le nom d'espace échantillon, noté Q 
(lettre grecque oméga). 


On lance un dé ordinaire. Q = {1,2, 3, 4, 5, 6}. + 
On lance deux fois un dé. Il y a 36 résultats possibles. 


Q = {(1, 1), (1, 2), …, (6, 6) + 


* Du latin a/éa : coup de dé, chance. 


Exemple 3 


Exemple 4 


Exemple 5 


5 Variables aléatoires et probabilités 145 


On choisit une personne au hasard et on observe la couleur de ses yeux. 


Q = fbleu, brun, gris, autre couleur . + 


Comme le montre l'exemple 3, la détermination de l'espace échantillon Q 
n'est pas toujours unique. On aurait très bien pu considérer d'autres 
couleurs, définir autrement les classes, etc. Il faut toutefois s'assurer que 
l'ensemble Q qu'on a choisi contient vraiment tous les résultats possibles de 
l'expérience et ne contient chacun qu'une fois. 


Au fond, cette détermination de Q est un problème de modélisation créer un 
modèle d'une situation concrète, c'est d'abord se concentrer sur les aspects 
essentiels ou pertinents de cette situation, quitte à ne pas prendre en 
compte les aspects secondaires ou négligeables. 


On choisit une personne au hasard et on observe le nombre de frères et 


sœurs qu'elle a. Ici, il est commode de prendre Q = {0, 1, 2, … }. Il est bien 
évident que personne n'a un million de frères et soeurs, mais il est bien 
délicat de choisir une borne qui ne serait pas arbitraire. + 


Événement Un événement est un sous-ensemble de l'espace échantillon. Le 
plus souvent, un événement peut aussi se définir au moyen d'une 
proposition affirmative du genre « la boule est bleue » ou « le résultat est 
impair ». Les deux représentations sont fondamentalement équivalentes : à 
toute proposition, qui peut être vraie ou fausse selon le résultat de 
l'expérience, on fait correspondre le sous-ensemble de Q composé des 
résultats pour lesquels la proposition est vraie. 


On lance trois fois un sou. Il y a 8 résultats possibles et on a 


Q = {PPP, PPF, PFP, FPP, PFF, FPF, FFP, FFF. 


Plusieurs événements peuvent être considérés. En voici quelques-uns 
présentés à la fois sous forme de proposition et sous forme de 
sous-ensemble. 


Proposition Sous-ensemble correspondant 
On a exactement deux faces. {PFF, FPF, FFP} 

On n'a que des piles. {PPP)} 

On a le même nombre de piles que de faces. S (sous-ensemble vide) 

On a plus de piles que de faces. {PPP, PPF, PFP, FPP} 


On a moins de 4 faces. Q (tout l'espace échantillon) 
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Il va sans dire qu'il y a souvent plusieurs façons de dire la même chose. 
L'événement « avoir deux piles » est le même que « avoir une seule face » et 
chacun d'eux correspond au même sous-ensemble {PPF, PFP, FPP}. 
L'événement impossible, correspondant au sous-ensemble vide %, de même 
que l'événement certain, correspondant à Q, peuvent aussi s'énoncer de 


bien des façons ! La représentation des évéments au moyen des 
sous-ensembles de Q a l'avantage de se prêter facilement à toutes les 
opérations qu'on peut faire sur les ensembles. + 


Avant d'aller plus loin, rappelons le sens et la portée des symboles utilisés. 
Si À et B sont deux sous-ensembles de Q, alors : 


ALUB (réunion de A, B) est formé des éléments de Q qui 
appartiennent à À ou à B. 


ANB (intersection de A, B) est formé des éléments de Q qui 
appartiennent à À et à B. 


A° (complément de À) est formé des éléments de Q qui 
n'appartiennent pas à A. 


A-B (différence de A, B) est formé des éléments de A qui 
n'appartiennent pas à B. A-B=An Be. 


On utilise les « diagrammes de Venn » pour visualiser les opérations sur les 
ensembles. 


AUB 
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Exemple 6 


Exemple 7 


Exemple 8 


La représentation géométrique suivante peut s'avérer particulièrement utile 
quand plus de deux ensembles sont en cause : 


(ANB)U (An C) 


Quand on joint deux propositions au moyen d'un « ou », on en obtient une 
nouvelle, qui sera vraie si l'une ou l'autre des deux premières propositions 
est vraie et qui ne sera fausse que si les deux propositions initiales sont 
fausses. Cette nouvelle proposition correspond au sous-ensemble À L B, 
formé par l'union des sous-ensembles À et B correspondant aux deux 
propositions de départ. 


La proposition composée « l'élève choisi est doué » ou « l'élève choisi est 
travailleur » correspond essentiellement aux élèves qui réussissent. + 


D'autre part, quand deux propositions sont jointes par un « et », il faut que 
les deux soient vraies pour que la nouvelle proposition le soit. Cette nouvelle 
proposition correspond donc au sous-ensemble À" B. 


La proposition « La personne est rousse et la personne est une femme » est 
vraie (et n'est vraie que) pour une femme rousse. + 


Enfin, la négation d'une proposition en donne une nouvelle qui est vraie si la 
première est fausse, et fausse si la première est vraie. Ce nouvel événement 
est donc le complément du premier. 


La proposition « il est faux que la personne est rousse » correspond à toutes 
les autres personnes : blondes, brunes, etc. + 
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Exemple 9 On lance deux fois un dé. 


(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 
(4,1 (4,2) (4,3) (4,4) (4,5) (4,6) 
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 
(6,1)(6,2)(6,3)(6,4)(6,5) (6,6) 


Q= 


Considérons les trois événements : 
A= «La somme des points égale 5. » 
B= «La face 2 est apparue au moins une fois. » 
C= «Les deux dés donnent la même face. » 

Ces événements correspondent aux sous-ensembles : 
A= {1 4), (2,3), (8, 2), (4, 1} 


B= {(L 2), (2, 2), (8, 2), (4, 2), (5, 2), (6, 2), (2, 1), (2, 3), (2, 4), (2, 5), 
(2,6); 


C= {L 1), (2, 2), (3, 3), (4,4), (5, 5), (6, 6)} 
On trouve alors, entre autres : 


AUB= {1 4), (2, 3), (3, 2), (4, 1), (1, 2), (2, 2), (4, 2), (5, 2), (6, 2), (2, 1), 
(2, 4), (2, 5), (2, 6) 


ANnB= {(2,3), (3,2) 
AULC= {(1,4), (2,3), (3, 2), (4, 1), (1, 1), (2, 2), (3, 8), (4, 4), (5, 5), (6, 6)} 
ANnC= © 


= {(1, 1), (1,3), (1, 4), (1, 5), (1, 6), (3, 1), (3, 3), G, 4), (8, s), (8, 6), 
(4,1), (4,3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 3), (5, 4, 6, 5), (, 6), 
(6,1), (6,3), (6,4), (6,5), (6, 6); 


ALŒ= (An =œ=Q 
Ab {(1, 4), (4, 1)} + 
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5.2 


PROBABILITÉS 


Afin de compléter le modèle probabiliste qui permettra de décrire le com- 
portement du résultat de l'expérience aléatoire considérée, il faut maintenant 
trouver une façon de déterminer la probabilité de chacun des événements 
que nous aurons à considérer. 


On peut déjà dire que la probabilité d'un des résultats d'une expérience 
aléatoire sera une mesure de l'importance de ce résultat dans l'ensemble de 
tous les résultats possibles de l'expérience. 


Il est souvent commode de se représenter la probabilité d'un événement 
comme une sorte de « poids ». Un poids total de 1 est réparti sur les éléments 
de l'espace échantillon. 


Plus le poids d'un résultat est grand, plus grande est la probabilité que 
l'expérience aléatoire donne ce résultat. Une fois déterminée la probabilité de 
chacun des résultats, c'est-à-dire de chaque élément de Q, il sera aisé de 
calculer la probabilité d'un événement, c'est-à-dire d'une partie de Q. 


Notons par P(n la probabilité (ou le poids) du résultat r. Les probabilités 
négatives (ou supérieures à 1) étant manifestement absurdes, on doit avoir, 
pour tout élément r de Q : 


O<P(r)<1. 


Notons au passage qu'on a rarement P(n = O car si un résultat est 
impossible, on n'avait pas à le mettre dans Q. Il arrive cependant qu'on ne 
sache pas à l'avance quelle sera la probabilité de chacun des éléments de Q ; 
ou encore qu'il soit naturel, pour effectuer des comparaisons, d'utiliser un 
même espace échantillon pour des expériences aléatoires légèrement 
différentes. Il est alors bien commode de pouvoir attribuer une probabilité 
nulle à certains résultats plutôt que de les retirer de l'espace échantillon. 


Une autre contrainte, déjà implicitement reconnue, est que la somme des 
probabilités de tous les résultats doit donner exactement 1. 


D PH) =f. 


reQ 


Remarque La notation D P(r) représente la somme des valeurs de Pfr) 


pour tous les éléments r de l'ensemble Q. 


Exemple 10 
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Quand la probabilité de chacun des résultats élémentaires est déterminée, la 
probabilité de n'importe quel événement À (sous-ensemble de Q) s'obtient en 
calculant la somme des probabilités des éléments qui le constituent. 


P(A) = D Pr). 


reA 


Le poids d'un objet est bien la somme des poids de ses parties ; ainsi en 
est-il de la probabilité d'un événement. 


On lance un dé. Q = {1, 2, 3, 4, 5, 6}. Si on suppose que le dé est bien 
équilibré, chacun de ces 6 résultats doit avoir la même probabilité. Le poids 
total de 1 sera donc divisé en 6 parties égales et on obtient : 


PS POYSPO)= PO) PEIS PISE 
6 


L'événement « le résultat est pair » correspond à l'ensemble À = {2, 4, 6} et on 
calcule : 


P(4)= Ÿ P(r)= P(2)+P(4)+ P(6) = os de. 
rEA 6 6 6 6 2 


Il y a donc une chance sur deux que le résultat du dé soit un nombre pair 
(et une chance sur deux qu'il soit impair). + 


Il arrive fréquemment que, par un simple argument de symétrie, on puisse 
facilement admettre que tous les éléments de Q sont équiprobables. La 
probabilité de chaque résultat est alors nécessairement 1/n, où n est le 
nombre d'éléments de Q. Dans ce cas, appelé modèle uniforme, la 
probabilité de n'importe quel événement À s'obtient par la formule : 


nombre de résultats favorables à À 
P(A) = 


nombre total des résultats possibles 
Card(A) 
| Card(Q) 


où la notation Card(A) désigne la cardinalité de À, c'est-à-dire le nombre 
d'éléments de l'ensemble À. Rappelons que cette formule commode ne peut 
être utilisée que si le modèle uniforme est satisfait, c'est-à-dire si tous les 
éléments de Q ont la même probabilité. 
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Exemple 11 


Exemple 12 


Exemple 13 


C'est ce qui arrive dans la plupart des situations reliées aux jeux de hasard : 
les faces d'un dé, les cartes d'un jeu sont au départ équiprobables. Les 
calculs de probabilité se ramènent alors à des problèmes de dénombrement. 
La symétrie de telles situations, c'est-à-dire le fait que chaque résultat ait la 
même importance, permet alors d'attribuer une probabilité « a priori » à 
chacun des résultats. 


Un vase contient 3 boules blanches et 7 boules noires. On tire une boule au 
hasard. Considérons l'événement À = « la boule tirée est blanche ». 


En utilisant des indices qui permettent de bien distinguer chacune des 
boules, on peut écrire : 

Q = {b;, D, b3, hi, n3, 3, ha 5, hé Ni} 
et A= {b:, b, b3} 
Toutes les boules ayant exactement le même statut, le modèle uniforme peut 
être appliqué et on obtient : 
: Card(A) : 3 


ES + 
Card(Q) 10 


P(A) 


Considérons une classe qui compte 25 élèves, dont 5 sont blonds et 
20 bruns. Alors l'expérience « observer la couleur des cheveux d'un élève tiré 
au hasard » est de même nature que celle de l'exemple 11. On aura 


P(« blond ») = DE = 0,2 et P(« brun ») = 20 25 = 0,8. + 


La plupart des situations concrètes, par contre, ne débouchent pas sur des 
résultats aussi symétriques et ne permettent pas d'identifier des probabilités 
a priori. La probabilité de chaque résultat doit alors être estimée de façon 
empirique ; c'est le plus souvent la fréquence de ce résultat, telle que calculée 
à partir de données déjà disponibles ou des résultats d'une suite 
d'expériences ad hoc. 


Supposons que nous nous demandions quelles sont les chances qu'il pleuve 
un 10 juillet. L'expérience aléatoire ici est l'observation du temps le 10 juillet 
et, pour simplifier, on peut dire que Q = {pluie, beau temps}. Nous 
consultons les archives météorologiques et nous y trouvons qu'il a plu 
22 fois durant les 117 dernières années, un 10 juillet. Personne ne sera alors 
surpris si nous disons qu'une estimation raisonnable de la probabilité qu'il 
pleuve un 10 juillet est de « 22 sur 117 », donc de 0,188. + 
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Remarque La distinction entre le cas empirique et le cas a priori peut se 
révéler délicate ; c'est ainsi qu'on pourrait attribuer a priori la probabilité LA 
au résultat « avoir un garçon » lors d'une naissance, alors qu'en réalité la 


probabilité (empirique) est légèrement supérieure à A . 


Quelle que soit la façon dont les probabilités sont obtenues (de façon 
empirique ou a priori, elles obéiront à un certain nombre de lois, que nous 
allons maintenant présenter. Chacune de ces lois pourrait être formellement 
démontrée, mais il nous a plutôt semblé préférable d'en donner une illus- 
tration géométrique. On conviendra, pour ce faire, qu'une fois Q représenté 
par un rectangle d'aire 1, un événement quelconque A sera représenté par 
une surface d'aire P(A). Cette illustration (ou représentation) permet de 
visualiser parfaitement aussi bien les lois ci-dessous que toute autre relation 
impliquant des probabilités. 


Lois des probabilités 
LOI 1 : PQ)=1 

« L'événement certain a probabilité 1. » 
LOI 2 : PAO)=0 

« L'événement impossible a probabilité O. » 
LOI 3 : P(A‘) = 1 — P(A) 


« La probabilité qu'un événement ne se produise pas est 1 moins la 
probabilité qu'il se produise. » 


Illustration 
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L'aire de AC vaut celle de Q moins celle de À. Étant donné notre convention, 
P(A9 = 1 -— P(A). 
LOI 4 : P(A L B) = P(A) + P(B) - P(AN B) 


Illustration 


L'aire de À L B s'obtient en additionnant les aires de À et de B ; mais alors 
l'aire de la partie commune (A n B) est comptée 2 fois (1 de trop). D'où 
P(A 0 Bj) = P(A) + P(B) - P(AN B). 


L'illustration ci-dessus suggère que la loi 4 prend une forme 
particulièrement simple quand À et B sont disjoints : 


Si AN B= 0, on dit que A et B sont incompatibles ; dans ce cas 
P(A L B)j) = P(A) + P(B). 


Illustration 


Exemple14 
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LOI 5 : P(A- B) = P(A)- PANB) 


En effet, on peut écrire À = (AN B) L (AN B9 et, puisque les événements B 
et BC sont incompatibles, les événements A n Bet À NA B£ le sont aussi. En 
vertu de la remarque précédente, on trouve donc que P(A) = PA A B) + 
P(A N B£). Enfin, utilisant la définition de À -B, on obtient : 

P(A - B) = P(AN B9 = P(ÀA) - P(AN B) 


Illustration 


Indépendance Nous voulons maintenant évaluer la probabilité d'une 
intersection : P(A N B). 


Deux cas peuvent alors se présenter, selon que À et B ont, ou non, de 
l'influence l'un sur l'autre. Voyons d'abord en détail le cas où À et B n'ont 
pas d'influence réciproque (le second cas sera développé à la section 5.3). 


Deux événements A et B sont dits indépendants s'ils n'ont aucune influence 
l'un sur l'autre ; autrement dit, si la probabilité de l'un n'est d'aucune façon 
modifiée par le fait que l'autre soit ou non réalisé. Cette définition de 
l'indépendance, verbale et intuitive, se traduit mathématiquement par la loi 
suivante. 


LOI 6 : Aet B sont indépendants si et seulement si P(AN B) = P(A)P(B) 


On tire une carte au hasard dans un jeu ordinaire de 52 cartes. Considérons 
les événements : 


A = « La carte est un Y.» 


B = « La carte est un Roi. » 
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Aet B sont indépendants : en effet Card(Q) = 52, Card{(A) = 13, Card(Bj) = 4 et 


Card(A n B) = 1. On obtient donc P(A n B)= + = + x À = P(A)P(B). 


Cela est aussi en accord avec notre intuition : que la carte tirée soit ou non 
un Roi, la probabilité qu'elle soit un Ÿ demeure toujours !. + 


Remarque Dans le cas d'événements dont la probabilité est définie 
empiriquement par leur fréquence relative, l'indépendance apparaîtra, à 
l'occasion, comme une sorte d'évidence intuitive ; il en est sûrement ainsi, par 
exemple, lors du choix au hasard d'un citoyen canadien adulte, de l'événement 
« il a les cheveux blonds » et de l'événement « il conduit une voiture à 4 portes ». 
L'indépendance n'est toutefois établie mathématiquement que par la 
vérification de l'identité 


PAR B) = P(A) x P(B) 


par exemple, en utilisant le tableau des fréquences conjointes, comme au 
chapitre 3. 


Indépendance de plusieurs événements La notion d'indépendance se 
généralise à plus de deux événements. On dira que n événements A1, A2, …, 
AA sont indépendants si aucun d'entre eux n'est influencé par la réalisation 
ou la non-réalisation des autres. L'énoncé mathématique correspondant est 
plus complexe que celui de la loi 6 ; voyons-le dans le cas où n =38. 


LOI 6" : (cas n = 3) 
A1, Aet A3 sont des événements indépendants si et seulement si 
P(Aï N A2) = P(Ai)P(A) 
P(Ai N A3) = P(A)P(A3) 
P(A2 N A3) = P(A2)P(A3) 
P(A N A: N A3) = P(A)P(A2) P(A3). 


La propriété « la probabilité de l'intersection égale le produit des probabilités 
individuelles » doit donc être vérifiée pour les événements pris 2 à 2 et 3 à 3. 
Dans le cas de n événements, ladite propriété devra être vérifiée pour les 
événements pris 2à 2,3à3,...nàn. 
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Exemple 15 Dans une manufacture, trois systèmes d'alarme sont installés de telle façon 


que n'importe lequel des trois va sonner si quelque chose d'anormal se 
produit. Si chacun des trois systèmes a une probabilité de 0,95 de bien 
fonctionner, quelle est la probabilité que l'alarme soit déclenchée si c'est 
nécessaire ? 


Solution 


P(l'alarme sonne) 


P(au moins un des systèmes fonctionne) 


1 —- Plaucun des systèmes ne fonctionne) 
En supposant que les trois systèmes fonctionnent indépendamment, on a : 
P(aucun des systèmes ne fonctionne) 
= P(1er ne fonctionne pas et 2° non plus et 3° non plus) 
= P(1® ne fonctionne pas) x P(2° non plus) x P(3° non plus) 
= 0,000 125. 
Donc P(Falarme sonne) = 1 - 0,000 125 = 0,999 875. 


5.3 


PROBABILITÉS CONDITIONNELLES 


Quand deux événements À et B sont indépendants, on évalue la probabilité 
que l'un et l'autre se produisent par la formule P(A A B) = P(A)P(B). Dans la 
mesure où un calcul de probabilité se ramène très souvent à un exercice de 
dénombrement, cette identité correspond au principe de base de la 
combinatoire, qu'on pourrait formuler ainsi : 


« Si une opération peut être faite de n façons et si une deuxième peut l'être 
indépendamment de m façons, alors les deux ensembles peuvent être faites 
de mx n façons. » 


Ainsi, quelqu'un ayant 4 pantalons et 5 chemises peut arborer 20 (= 4 x 5) 
tenues vestimentaires différentes. Toutefois, il peut arriver que le choix de la 
chemise dépende du pantalon choisi, ce qui modifie les calculs. En somme, il 
arrive que des événements ne soient pas indépendants. Voyons d'abord un 
exemple technique avant d'élaborer une formule pour le calcul de P(A S B) 
dans les cas de dépendance. 
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Exemple 16 


Exemple 17 


On lance un dé. Posons 

A = «le résultat est pair » ; 

B = « le résultat est plus grand ou égal à 5»; 

C = « le résultat est plus grand ou égal à 3 ». 

On a À = {2,46}, B= {5,6}, C = {3,4,5,6}, et An C= {4,6}, BnC = {5,61}. 
On trouve donc que : 


P(A)P(O) = 5 x £ = = PAN OC) (A et C sont indépendants). 


PBAQ = £ x £ = £ + 2 = PB n C) (Bet C ne sont pas 


6 9 


indépendants). + 


Deux événements, tels B et C dans l'exemple 16 ci-dessus, qui ne sont pas 
indépendants, sont dits dépendants. Voyons un exemple qui suggère une 
façon de calculer alors P(A A Bj. 


Un sac contient 3 boules noires et 2 boules blanches. On tire 
successivement (sans remise) deux boules du sac. Quelle est la probabilité 
que ces deux boules soient noires ? 


Définissons les deux événements suivants : 
A = « La première boule est noire. » 
B = « La deuxième boule est noire. » 


L'événement qui nous intéresse, « les deux boules sont noires », est 
l'événement À N B. On veut calculer P(A Sn Bj. 


On conviendra aisément que, pour que À N B soit réalisé, il faut d'abord que A 
soit réalisé, ce qui se produira avec une probabilité égale à *X. Il faudra 
ensuite que la seconde boule soit noire aussi. Or, on a déjà, en réalisant A, 
retiré une boule noire du sac qui ne contient, pour le second tirage, que 4 
boules : 2 blanches et 2 noires. La probabilité que la seconde boule soit noire 
sachant que la première boule était noire est donc % . La probabilité que les 


deux boules soient noires s'obtient alors en calculant P(A NB) = X x % = ÿ,.+ 


Exemple 18 


5 Variables aléatoires et probabilités 159 


Dans l'exemple qui vient d'être présenté, nous avons calculé P (A = B) au 
moyen de la formule : 


| __PANB=PA)ABIA) | 


La barre verticale se lit « quand », « sachant que » ou « étant donné que ». 
Cette formule générale s'applique à toutes les situations. Par symétrie, on 
peut aussi l'écrire sous la forme : 


P(A NB) = P(B)P(A1B) 


La probabilité que deux événements se réalisent est le produit de la 
probabilité que l'un deux se réalise par la probabilité que le second se réalise 
aussi sachant que le premier événement est réalisé. Le terme P(A]B) désigne 
la probabilité conditionnelle de À sachant que B est réalisé. En divisant 
par P(B) les deux membres de l'égalité P(A = B) = P(B)P(A|B) on obtient : 
P(ANB) ; 
P(AÏB) = ———— (si P(B) # 0). 
P(B) 


Symétriquement, P(B|A) est la probabilité conditionnelle de B sachant que A 
est réalisé. On obtient de la même façon 


P(B|4) = 7e (si P(A) # 0). 


Comme le montrent ces formules, les probabilités conditionnelles P(A]|B) et 
P(B| A) mesurent respectivement l'importance relative de À N B par rapport à 
Bet à A. 


Le traitement des probabilités conditionnelles est donc tout à fait analogue à 
ce qu'on a déjà fait, dans le chapitre 3, au sujet des distributions 
conditionnelles : la donnée d'une condition B fait qu'on ne considère plus, de 
l'espace échantillon Q, que la « tranche » où la condition B est réalisée. 


On lance un dé qui donne X points. Calculer : P{X est pair | X > 4). 
Définissons les événements : 

A=«Xest pair ». 

B=«X>4». 
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Exemple 19 


Dans l'espace échantillon Q = {1,2,3,4,5,6}, les événements À, Bet An B 
sont : À = {2,4,6}, B= {4,5,6! et A N B= {4,6}. 


On trouve donc : 


P(ANB) % 2 
AE UE 


Cette réponse est en accord avec l'intuition : si X2> 4, trois valeurs seulement 
sont possibles, 4, 5, et 6, parmi lesquelles deux sont paires et une seule est 
impaire. + 


On lance deux dés. Calculer : 
P(la somme des points est > 9]|la face 6 ne paraît pas). 
Définissons les événements : 
A = « La somme des points est > 9. » 
B = « La face 6 ne paraît pas ». 
Résultat du deuxième dé 


1 2 3 4 5 6 


Résultat du premier dé 


L'espace échantillon Q est un ensemble de 36 éléments. On peut le 
représenter par la grille ci-dessus. 


Le lancement des deux dés correspond au choix aléatoire de l'une ou l'autre 
des 36 cases (équiprobables) de la grille. Marquant d'un A ou d'un B les 
cases pour lesquelles les événements correspondants sont réalisés, on 
obtient la nouvelle grille qui paraît à la page opposée. 
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L'observation des lettres de cette grille donne P(A) = +, P(B) = © et 
P(A N B}) = +. On trouve donc : 
P(ANB) Y% 3 
PB)  % 25 


P(A]B) = 


Si la face 6 ne paraît sur aucun dé, il y a donc 3 chances sur 25 que la 
somme des points soit supérieure ou égale à 9. + 


On a déjà vu que deux événements A et B sont indépendants si P(A N Bj) = 
P(A)P(B). Si À et B sont indépendants on obtient donc : 


P(AÏB) : P(ANB) : P(4)P(B) = p(4) 
P(B) P(B) 
et 
P(B|4) - P(ANB) : P(4)P(B) = p(B) 
P(4) P(4) 


ce qui nous redonne la définition intuitive de l'indépendance : deux 
événements sont indépendants si la réalisation de l'un ne modifie pas la 
probabilité de réalisation de l'autre. 


Résultat du deuxième dé 


Lo) 
TD 
S 2 
Ë 
G 3 
=] 
TD 
5 4 
5 
ê 
S 5 
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Exemple 20 


Dans plusieurs situations, les événements considérés sont notoirement 
indépendants. Quand ce n'est pas le cas, des informations supplémentaires 
peuvent nous aider ; l'exemple qui suit illustre une façon simple d'utiliser de 
telles informations. 


Soient À et B deux événements tels que : 
P(4)= 0,5 ; P(B)= 0,3 ; P(4N B)= 0,2. 
Trouver : 
a) P(AUB) 
b) P(4cnB) 
Solution 
a) D'après la loi 4, 
P(AUB)= P(4)+P(B)-P(ANB) 
= 0,5+0,3—-0,2 = 0,6 


b) Dans une situation comme celle-ci, il est commode de considérer le 
tableau suivant (qui n'est rien d'autre qu'un tableau de distribution 


conjointe) : 
B B° 
A PANB) P(4 N B°) P(4) 
A° P(4 NB) P(4° N B°) P(4°) 
P(B) P(B°) Il 


où il est facile de voir que chaque ligne (chaque colonne) est formée 
d'événements incompatibles ; par exemple, À n Bet AA B sont 
incompatibles (car À et A° le sont) et leur union (A An Bj L (AN B)j est 
égale à B. On a donc 


P(B)= P(A4 N B)+ PA NB). 


Si l'on revient au problème posé, on complète le tableau comme suit : 


B |& B |& B |& 
A |0,2 0,5 A |0,2 0,5 A |0,210,3/0,5 
A° A° 0,5 A° |0,110,4])0,5 
0,3 1,0 0,3 | 0,7 | 1,0 0,3 | 0,7 | 1,0 


Donc P(A°A B) = 0,1. + 
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5.4 


VARIABLES ALÉATOIRES 


Une variable aléatoire est une caractéristique numérique résultant d'une 
expérience aléatoire. À toutes fins pratiques, une variable aléatoire est donc 
simplement une quantité qui varie au hasard. 


Comme pour les variables statistiques déjà rencontrées dans les quatre 
premiers chapitres, les variables aléatoires sont conventionnellement 
représentées par des lettres majuscules habituellement choisies vers la fin 
de l'alphabet (X, Y, Z, S, .… ), alors qu'on réserve les premières lettres (A, B, 
C, .… ) pour identifier les événements. 


Une variable aléatoire peut être discrète ou continue. Nous ne traiterons ici 
que des variables discrètes ; le cas continu sera abordé dans le chapitre 7. 


Le comportement d'une variable aléatoire X discrète est complètement décrit 
par la donnée de deux listes : 


a) la liste des valeurs x1, x2, … , Xn possibles pour X ; 
b) la liste des probabilités p(x), p(x2), … , p(xr) de chaque valeur possible. 


L'expression p(x) est une notation concise qui représente P(X = x), la 
probabilité que la variable aléatoire X prenne la valeur x. On peut aussi 
écrire simplement pi, Pa, … Pn, au lieu de p(xi), p(x), … , p(xn). 


Rappelons que le P majuscule s'applique aux événements ; on peut écrire 
P(A) ou P(X < 2), jamais p(A) ou p{X < 2). Le p minuscule, lui, s'applique 
directement aux nombres ; on peut écrire p(3), jamais p{X = 3). 


Les probabilités p1, p2, .… pn tiennent le même rôle, dans la description du 
comportement de la variable aléatoire X, que celui tenu par les fréquences fi, 
f2, … fn dans la description de la distribution des données expérimentales. 
On peut se représenter la probabilité pi comme étant la valeur théorique vers 
laquelle convergerait la fréquence fi si l'on pouvait répéter l'expérience une 
infinité de fois. 


La fonction p(x est appelée fonction de masse ou fonction de probabilité. 
Puisque les nombres p{xi), p(x2), .… , p(xr) représentent des probabilités, ils 
doivent satisfaire aux deux conditions suivantes : 


1. 0O<p(x)<lpouri=1,2,.….,n 


2: D ptx)=1 
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Exemple 21 


De même qu'on pouvait le faire pour illustrer les fréquences, on peut 
représenter la fonction de masse p(x au moyen d'un diagramme à bâtons. 


Un sac contient 10 billets de banque : 4 billets de 1 $, 3 billets de 2 $, 2 
billets de 5 $ et 1 billet de 10 $. On tire un billet au hasard ; il vaut X $. 


Les valeurs possibles pour X sont 1, 2, 5, et 10. Les probabilités de chacune 
de ces valeurs sont p{l) = #,, p(2) = #, p(5) = #,et p(10) = %,. 


Cette fonction de masse p(x est illustrée par un diagramme à bâtons 
(figure 5. 1). 


9.9 


FIGURE 5.1 


ESPÉRANCE ET VARIANCE 


Combien de points, en moyenne, un dé donne-t-il ? Pour répondre à cette 
question, imaginons que le dé est lancé un très grand nombre de fois ; 
disons 6 000 fois. Normalement, chacune des faces devrait apparaître 
environ 1 000 fois. Ce sont là les effectifs théoriques que nous savons déjà 
calculer. 


Puisque chacune des valeurs 1, 2, 3, 4, 5, 6 apparaîtra environ 1 000 fois, la 
somme des 6 000 résultats obtenus du dé devrait être voisine de : 


(1 000 x 1) + (1 000 x 2) + (1 000 x 3) + (1 000 x 4) + (1 000 x 5) + (1 000 x 6) = 21 000 
Illustration d'une fonction de masse p(x) au moyen d'un diagramme à bâtons 


p(x) 
0,5 


0,4 


0,3 


Fréquence 


Exemple 22 
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Le résultat moyen sera donc voisin de : 


21000 7 
= —=3,5 
6000 2 


On conviendra sans peine que si l'on pouvait lancer le dé une infinité de fois, 
la moyenne de tous les résultats serait exactement 3,5. Cette moyenne 
théorique porte le nom d'espérance mathématique. 


En fait, on n'a pas vraiment besoin d'imaginer une infinité d'observations 
d'une variable aléatoire X pour pouvoir en calculer l'espérance 
mathématique, notée E{X). On n'a qu'à appliquer la formule 


E(X) SA) 


Cette formule est analogue à celle qu'on a déjà amplement utilisée pour 
calculer la moyenne x à partir des fréquences fi : 


D. 


En y remplaçant les fréquences expérimentales fi par les fréquences 
théoriques (ou probabilités) p(x), la formule donne, plutôt que la moyenne 
expérimentale x, la moyenne théorique E{X). 


Considérons encore le sac et les billets décrits dans l'exemple 21. On 
obtient : 


4 3 2 1 
eo Esre-{et)e fes) ox). 
10 10 10 10 


En moyenne, le billet tiré du sac vaut donc 3 $, même si les billets de 3 $ 
n'existent pas ! Si on répétait 1 000 fois l'expérience, en replaçant le billet 
tiré afin de ne pas modifier la composition du sac, la valeur totale des 1 000 
billets tirés serait voisine de 3 000 $. + 


L'espérance mathématique d'une variable aléatoire X est aussi représentée 
par l'expression lu, (H = mu, le m grec) ou par L, s'il n'y a pas d'ambiguïté. Les 
notations u, (respectivement u) et E(X) sont équivalentes. 
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Exemple 23 


Exemple 24 


L'espérance mathématique peut aussi s'appliquer à une transformation d'une 
variable aléatoire donnée. Par exemple, E(X + 2) désigne la moyenne 
théorique de la variable X + 2 obtenue de X en lui ajoutant 2. De même, 
E(X) désigne la moyenne théorique du carré de X. 


Une transformation particulièrement utile est celle donnée par le carré de la 
distance entre X et sa moyenne. Elle conduit à la variance de X. 


Var(X) = E((X -u))= ZX (x, -n) plx,) 


Cette formule permet de calculer la moyenne théorique du carré de l'écart 
entre X et sa moyenne théorique. C'est l'analogue direct de la formule 
donnant la variance expérimentale s? : 


FE 
On n'a fait que remplacer les fi par leur équivalent théorique p(x) ainsi que 


remplacer x par son équivalent théorique lu. 


Considérons encore le sac contenant 4 billets de 1 $, 3 billets de 2 $, 2 de 
5 $ et 1 de 10 $. On a déjà calculé, dans l'exemple 22, que p = 3. On peut 
maintenant calculer que : 


Var(X)= Y (x, -u) p(x,) 
= (1-3) (0,4)+(2-3)°(0,3)+(5-—3)°(0,2)+(10—3)° (0,1) 
=(4x0,4)+(1x0,3)+(4x0,2)+(49x 0,1) 
= 7,6. 
En moyenne, le billet tiré vaut 3 $ ; de plus, comme on vient de calculer, le 


carré de la distance entre X et 3 vaut, en moyenne, 7,6. C'est une mesure de 
dispersion. + 


. . 2 2 . 2 : 
La variance Var(x) est aussi notée 6, (o = sigma, le s grec) ou 6 s'ilnya 


pas d'ambiguïité. Comme c'était le cas avec les données expérimentales, la 
racine carrée 6, (respectivement 6) de la variance théorique est aussi 


appelée écart-type (ou écart-type théorique). 
Considérons le nombre X de points donnés par un dé. 


On veut calculer u et o. 
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Les valeurs possibles pour X sont 1, 2, 3, 4, 5 et 6 et la probabilité de 
chacune de ces valeurs est . On trouve donc : 


E(X)= > x,p(x,) 


Do ee) 


conformément à ce qu'on a déjà vu au début de la section 5.5. On trouve 
aussi : 


2 7 2 
(e] Haro= EG, a) rG) = Es 2) p(x,) 
eee ere(e) 
=|1 x—+|2 X—+..+|6—-—| x— 
2 6 2 6 2 6 
É . É À L À L . É À É À 
= x + x + x + x + x + X 
4 6 4 6 4 6 4 6 4 6 4 6 
70 


35 
= — = —=2,91667 
24 12 


6 = Vo? =1,7078. 


+ 


ne : Go 
Remarque On sait déjà calculer s? au moyen de la formule rapide $2 =x° -x". 
La variance théorique o? se calcule aussi au moyen d'une formule analogue. 
On a 


o°=E(X")-(E(X)) 
= E(X°)-p°. 
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Exemple 25 Reprenant le calcul de la variance du nombre X de points donnés par un dé, 
on trouve 


E(X?)=Zx?p(x,) 


0 CS CEE) 


91 
= = 15,166 67. 
6 


Donc 
o'=E(X")-u" 
= 15,166 67 - (3,5)° = 2,916 67 
valeur obtenue, après un calcul plus lourd, dans l'exemple 24. + 


Propriétés élémentaires de EX) et de Var(X) Comme nous l'avons déjà fait 
remarquer, bien qu'une définition mathématique soit toujours suffisante 
pour les fins de calcul, son application mécanique conduit souvent à des 
calculs fort longs, qu'on peut abréger en développant, sous forme de 
« formules », quelques conséquences simples de la définition. C'est ainsi 
qu'en partant de la définition de E, nous pouvons déduire des formules pour 
E(bX), E(a + bX), E(X + Y), et qu'en partant de la définition de Var, nous 
déduisons des formules pour Var(bX), Var(a+ bX), Var(X + Y). Nous donnons 
ces formules sans démonstration : certaines sont d'ailleurs analogues aux 
formules que nous connaissons déjà pour x et s2. 


1. E(bX) = bE(X) 

2. E(a + bX) = a + bE(X) 
3. E{X + Y) = E(X) + E(Y) 
4. Var(a+ bX) = b2Var(X) 
5 


Si X et Ÿ sont indépendantes, alors 
Var(X + Y) = Var(X) + Var(Y). 


Nous n'avons pas encore formellement défini ce qu'étaient des variables 
aléatoires indépendantes. Intuitivement, deux variables aléatoires X et Y 
sont indépendantes si elles n'ont aucune influence l'une sur l'autre, 
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c'est-à-dire si le comportement conditionnel de l'une n'est pas affecté par la 
valeur prise par l'autre. Techniquement, le critère d'indépendance que nous 
avons utilisé pour les événements peut être adapté aux variables aléatoires 
et devient, dans le cas discret : X et Y sont indépendantes si, pour toutes 
valeurs xetyona 


PX = xet Y= y) = PX= xjP(Y = y). 


Avec cette définition, on peut montrer que si X et Y sont indépendantes, tout 
événement À qui ne porte que sur X et tout événement B qui ne dépend que 
de Y sont indépendants. 


Les formules qui permettent de calculer l'espérance et la variance d'une 
somme (ou d'une différence) de deux variables aléatoires se généralisent 
directement à une somme arbitrairement longue. On obtient les formules 
suivantes : 


1. Pour l'espérance : 


EX +X+.+X,)=EX)+..+EX) 


2. Pour la variance : 


Si Xi, …, X, sont indépendantes, 


Var(Xi +... + X,) = Var(X:) +. + Var(X,) 


Exemple 26 On lance 1 000 dés. Posons Y = « Le nombre total de points obtenus ». On 
veut calculer E(Y) et Var(Ÿ). Posons Y = X1 + X2 +... + X1 000, Où X1, X2, …, 
X1000 désignent les résultats successifs de chacun de ces lancers. Dans 
l'exemple 24, on a déjà calculé que chacun de ces Xi a une espérance de 3,5 


et une variance de 2,916 67. On trouve donc 
E(Y)=E(X +X, ++ X 


F2 


SEX )JHECX, ) Hi FEX ni) 
=3,5+3,5+...+3,5 
= 1 000 x 3,5 


= 3 500. 
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Exemple 27 


En vertu de l'indépendance des variables X1 + X2 +... + X1 000 on trouve aussi 


Var(Y)=Var(X,+X, +..+X 000 ) 


=Var(X,)+Var(X,)+...+Var(X, 5600 ) 


= 1000 x2,916 67 
=2916,67. 


L'écart-type © vaut donc 4/2 916,67 = 54,01. 


En lançant 1 000 dés on obtient donc en moyenne 3 500 points. On a de 
plus calculé que le nombre de points obtenus (Y) est en général de 3 500 
+ 54. + 


Dans une serre expérimentale, une parcelle de terre est découpée en 4 carrés 
identiques. Sans engrais, la production de tomates pour chaque carré est 
une variable d'espérance 600 kg et d'écart-type 60 kg. En utilisant un 
certain engrais, l'espérance sera de 630 kg avec un écart-type 80 kg. 
Supposons que 2 carrés sont semés sans engrais et 2 avec engrais. 


a) Soit T la production totale des 4 carrés. Quelle est l'espérance et l'écart- 
type de T? 


b) Soit X la production moyenne des deux lots avec engrais et Y la 
production moyenne des deux lots sans engrais. Quelle est l'espérance et 
l'écart-type de la différence X- Y? 


Solution : Soit X1, X2 et Y1, Y2 les productions des lots avec et sans engrais, 
respectivement. Alors E(X;) = E(X2) = 630, Var(X) = VarX2) = (80)? ; E(Y1) = 
E(Y2) = 600, Var(Y1) = Var(Y2) = (60)2. 


Nous supposerons que ces 4 variables sont indépendantes, puisque la 

culture dans un carré n'est pas affectée par celle d'un autre. 

a) T=X1+X2 + Yi + Y2. Donc E(T)= E(X1 + X2 + Ya + Yo) = E(X1) + E(X2) + E(Y:) 
+ E(Y2) = 630 + 630 + 600 + 600 = 2 460. 


Var(T) = Var(X1 + Xo + Ya + Ya) = Var(X1) + Var(X) + Var(Y1) + Var Y) = 
(80)2 +(80)2 +(60)2 +(60)2 =2 000. 


Donc, l'écart-type de Test 920 000 = 141,42. 


b) X = (1/2)( Xi + X2), Y = (1/2)( 1 + Y), E(X) = (1/2)(E(X + X)) = 
(1/2)(630 + 630) = 630, E(Y) = 600. 
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Var(X) -[ Var(X +X,) 

2 
1 Ÿ 

-{ [Var(X )+ Var(X,)] 
6] 2 2 

=|—| (80° +80) 
2 

= 3 200 


Var(Ÿ) = 1 800. Donc E({X -— Y) = 630 -— 600 = 30 et Var(X — Y) = Var(X) + Var(Ÿ) 
= 3 200 + 1 800 = 5 000. L'écart-type de X- Y est donc Y5 000 = 70,71. 


RÉSUMÉ 


1. L'espace échantillon d'une expérience aléatoire est l'ensemble de tous 
les résultats possibles de cette expérience. 


2. Un événement est un énoncé relatif au résultat d'une expérience. 
Chaque événement correspond à un sous-ensemble de l'espace 
échantillon. 


3. À chaque résultat r est associée une probabilité P(r) qui est un nombre 
compris entre O et 1. La somme des probabilités de tous les résultats de 
l'expérience vaut 1. La probabilité d'un événement À est la somme des 
probabilités des éléments de A. 


4. Si tous les éléments de Q sont équiprobables (modèle uniforme), la 
probabilité d'un événement À peut être obtenue en calculant : 
PCA) nombre de résultats favorables à 4  Card(A) 
nombre total de résultats possibles Card(Q) | 


5. I P(Q)= 1 où Q est l'espace échantillon (événement certain). 
IH P(S) = 0 où S est l'ensemble vide (événement impossible). 
IT P(Ad = 1 -— P(A), où Ac est le complément de A. 
IV P(AU Bj) = P(A) + PB) - P(A NB). 
V P(A-B) = P(A) - PA NB). 
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VI Deux événements À et B sont indépendants si et seulement si 
P(4 N B) = P(A)P(B). 
6. Aet B sont dits incompatibles si À N B= ©. Dans ce cas, 
P(4 L B) = P(4) + P(B) 


7. P(AN B) = P(A)P(B| À) = P(B)P(A|B) où P(B| A) désigne la probabilité que 
B se produise sachant que A s'est produit : 


P(ANB) 
P(A|B)=—=— (si P(B) +0) 
P(B) 
où 
P(ANB) 
P(B|A)=—=—— (si P(A) + 0) 
P(4) 


8. Si deux événements À et B sont indépendants, alors 
P(4/B) = P(4) et P(B|4) = P(B). 


9. On appelle variable aléatoire une caractéristique numérique des 
résultats d'une expérience aléatoire. Une variable aléatoire est donc une 
quantité qui varie au hasard. 


10. Soit X une variable aléatoire discrète dont l'ensemble des valeurs 
possibles est {x1, x2, …, xn}. On appelle fonction de masse bp la fonction 
définie par 


pli) = FX = x). 
11. L'espérance mathématique FE(X) de X est définie par 
= E(X)= Yx,p(x,) 
et sa variance Var(X) est définie par 
7 =Var(X)= X (x, -E(X)) p(x,) = ECX?)-(E(X)). 


12. L'espérance et la variance d'une variable aléatoire jouissent des 
propriétés suivantes : 


I ÆE(bX) = bE(X) 
I E(a + bX) a + bE(X) 
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IT ÆEX+ Y) = E(X) + E(Y) 
IV  Var(a + bX) = b2Var(X) 
V SiXet Y sont indépendantes, alors 


Var(X + Y) = Var(X) + Var (Y). 


13. Deux variables aléatoires discrètes X et Y sont indépendantes si, pour 
toutes valeurs de xetyona 


PX = xet Y= y) = PX= xXP(Y= y). 


Si X et Y sont indépendantes, il suit que tout événement À qui porte 
uniquement sur X et tout événement B qui porte uniquement sur Y sont 
indépendants. 


EXERCICES 


ESPACE 
ÉCHANTILLON 1. Pour chacune des expériences aléatoires suivantes, donnez une des- 


cription rigoureuse de Q ; si possible, énumérez-en les éléments. 
a) Lancer 4 sous et observer le résultat. 


b) Interroger des gens sur le parti fédéral qu'ils favoriseraient s'il y avait 
élection le lendemain. 


c) Observer la température maximale un 10 janvier. 
d) Observer la température maximale un 12 juillet. 
e) Lancer 3 dés et observer la somme des nombres obtenus. 


f) Tirer un échantillon de 10 pneus dans la production d'une firme Net 
compter le nombre de pneus défectueux. 


g) Observer le type d'habitat d'un Québécois choisi au hasard. 


2. À une personne choisie au hasard, on pose un certain nombre de 
questions sur la peine capitale. Considérons les événements suivants : 


A : La personne choisie répond « oui » à la question : « Êtes-vous en 
faveur de la peine de mort pour le meurtre d'un policier ? » 


B : La personne choisie répond « oui » à la question : « Êtes-vous en 
faveur de la peine de mort pour un meurtre commis par un 
détenu en prison ? » 
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3. 


C : La personne choisie répond « oui » à la question : « Êtes-vous en 
faveur de la peine de mort pour tout meurtre ? » 


D : La personne choisie répond « oui » à la question « Ÿ a-t-il des 
crimes pour lesquels vous favorisez la peine de mort ? » 


E : La personne choisie répond « oui » à la question : « Êtes-vous en 
faveur de l'abolition totale de la peine de mort ? » 


a) Décrivez en mots les événements suivants : 
il) A-C ii) AU B iii) DLUE IV ANNE 
b) Quelle est la relation entre les événements C et À ? 


Un sac contient 2 billes identiques sauf pour la couleur : une verte et 
une jaune, et une balle de golf blanche. On tire au hasard un des 3 
objets du sac : 
a) Peut-on dire a priori que P(j) = P(v) = P(b) ? 
b) Lesquelles des affirmations suivantes sont vraies ? 

i) P(v) = PQ) ü) P(b) = 1 ii) P(v) + PQ) + P(b) = 1 

iv) P(b) = 0 v) P(v) = P(b) vi) Si P(v) = 1/4, P(b) = 1/2. 


Une expérience aléatoire a quatre résultats possibles : r, r, ra, ra. 
Lesquelles des données suivantes sont acceptables, et pourquoi ? 


a) P{r) = 0,2 ; P(r2) = 0,3 ; P{rs) = 0,4 ; Pr) = O 

D). Pr) = 0,2% Pr) = 10; Pre) = 0,1 ; Pr) = 0,1 

©) P(n)=0; Pr) = 0; Pr) = 0 ; Pr) = 1 

d) P(n)=1/2; P(n) =-1/2; P(rs) = 1/2; P(r4) = 1/2 

On choisit au hasard une personne parmi les étudiants d'une classe; 
considérons les événements suivants : 


À : La personne choisie est une fille. 

B : La personne choisie est un garçon. 

C : La personne choisie a les yeux bleus. 

D : La personne choisie a les cheveux blonds. 


Décrivez en mots le « contenu » de chacun des éléments suivants : 
ALU B,ANC,A,CNnD, ChD ANnNCND,A-C,D-C,D-B. 

Soit P(A) = 0,3 ; P(B) = 0,5; P(A LU Bj) = 0,7. Trouvez : 

a) PANB) b) P(A U B:) c) PB NA A 
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Un architecte soumet un projet à deux bureaux X, Y. Supposons que la 
probabilité que X accepte le projet est de 0,5, celle que Y refuse est de 0,6 
et celle que le projet soit rejeté par au moins un bureau est de 0,7. 
Trouvez la probabilité : 
a) que les bureaux X et Y acceptent le projet ; 
b) que X accepte le projet, mais Y le refuse ; 
c) qu'au moins un des bureaux accepte le projet. 
On prend au hasard un enfant dans une classe. Considérons les 
événements suivants : 
M : L'enfant est un garçon. 
F : L'enfant est une fille. 
D : L'enfant est droitier. 
G : L'enfant est gaucher. 
Si P(M = 0,5; P(G = 0,1 et P(F N G = 0,03, déterminez P(F), P(D), 
PF QG, P(FN D). 
On choisit une personne au hasard. Les événements À et B ci-dessous 
sont-ils incompatibles ? Sont-ils, d'après vous, indépendants ? L'un est-il 
contenu dans l'autre ? 
a) A: La personne choisie est une femme. 
B : La personne choisie est un homme. 
b) A: La personne choisie est pour l'abolition du droit de grève dans le 
secteur public. 
B : La personne choisie est d'avis que le droit de grève est un droit 
inaliénable de tous les travailleurs. 
c) A: La personne choisie est pour l'abolition du droit de grève pour 
tous les travailleurs. 


B : La personne choisie est pour l'abolition du droit de grève dans le 
secteur public. 


d) A: La personne choisie a les cheveux blonds. 

B : La personne choisie a un quotient intellectuel supérieur à 100. 
e) A: La personne choisie mesure plus de 1,50 m. 

B : La personne choisie mesure plus de 1,30 m. 
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VARIABLES 
ALÉATOIRES 


10. 


11. 


12. 


15. 


14. 


f A: La personne choisie mesure moins de 1,70 m. 
B : La personne choisie mesure plus de 5 m. (Utilisez la définition 
mathématique de l'indépendance) 
g) A: La personne choisie mesure moins de 1,70 m. 
B : La personne choisie a les yeux bleus. 


Une boîte renferme 8 billes rouges, 3 blanches et 9 vertes. Si l'on extrait 
sans remise 3 billes au hasard, calculez la probabilité que : 
a) les 3 billes soient rouges. 

les 3 billes soient blanches. 


b) 
c) les 2 premières billes soient rouges, la 3e blanche. 
d) au moins une des billes soit blanche. 

€) 


les billes soient tirées dans l'ordre rouge, blanche, verte. 


Une étudiante suit un cours de marketing et un cours de statistique. La 
probabilité qu'elle réussisse en marketing est de 0,5 et en statistique de 
0,7 ; la probabilité qu'elle réussisse les deux cours est de 0,3. Calculez 
chacune des probabilités suivantes : 

a) Elle réussit au moins un des deux cours. 

b) Elle échoue les deux cours. 

c) Elle échoue en statistique et réussit en marketing. 

De chaque expérience aléatoire suivante, isolez une ou deux variables 
aléatoires et donnez-en les valeurs possibles. 

a) D'une urne contenant 3 billes rouges et 4 vertes, tirer une bille. 

b) D'une urne contenant 5 billes rouges et 6 vertes, tirer trois billes. 


c) D'une assemblée où siègent 10 femmes et 8 hommes, extraire un 
comité de 4 personnes. 


d) Choisir un étudiant au hasard dans la classe. 
On lance 4 pièces de monnaie ; soit X le nombre de faces. Déterminez la 


fonction de masse de X et faites-en une représentation graphique. 
Calculez E(X) et Var(X). 


On assigne un numéro distinct à chacun des 1 000 invités à un « party » 
de bureau. On procède ensuite au tirage au hasard d'un numéro; le 
gagnant reçoit un cadeau de 100 $. 

a) Soit X le gain d'un des invités. Déterminez E{X) et Var(X). 

b) Soit X le gain d'un couple d'invités. Déterminez E(X) et Var(X). 


DIVERS 


15. 


16. 


17. 


18. 


20. 
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On assigne un numéro distinct à chacun des 1 000 invités à un « party » 
de bureau. On procède ensuite au tirage aléatoire de deux numéros, sans 
remise ; le premier gagnant reçoit un cadeau de 1 000 $, le second 
100 $. 

a) Soit X le gain d'un des invités. Déterminez E(X) et Var(X). 

b) Soit X le gain d'un couple d'invités. Déterminez E(X) et Var(X). 

Un dé est pipé de telle sorte que tous les nombres ont la même chance 
d'apparaître, sauf le 1 qui a trois fois plus de chances d'apparaître que 
chacun des autres. 

a) Calculez la probabilité d'avoir un nombre < 4. 

b) Si vous jouez systématiquement le 1, gagnant 5 $ quand il sort et 


perdant 1 $ dans les autres cas, quelle est votre espérance de gain ? 


Soit X la valeur dans un an d'une action de la compagnie À et Y la valeur 
dans un an d'une action de la compagnie B. Supposons que E(X) = 30, 
Var(X) = 25, E(Y) = 40, Var(ÿ) = 16, et que, de plus, X et Y sont 
indépendantes. 
a) Déterminez la valeur totale dans un an de 

i) 8 actions de À et 9 actions de B; 

ii) 12 actions de A et 6 de B. 
b) Discutez l'hypothèse que X et Y sont indépendantes. 
Votre ami et vous achetez chacun un billet de loterie. Soit X, votre gain 
brut et X2 le sien. Supposons que X\ et X sont indépendantes, les deux 
de moyenne 1,50 $ et d'écart-type 10 $. Vous décidez de partager les 


gains éventuels. Soit X votre gain sous cette hypothèse. Calculez E{X) et 
Var(X) ; comparez avec l'espérance et la variance de X, et X2. 


. Soient À et B deux événements incompatibles ; dites pourquoi la 


situation suivante est impossible : 
P(A) = 0,4, P(B)=0,3, P(A:An Bi = 0,2 


Une boîte contient 5 billes, dont 2 sont marquées [1], 1 est marquée [2] et 
2 sont marquées [3]. On tire une bille et on note X son numéro ; on tire 
une deuxième bille (sans remettre la première) et on note Y son numéro. 
Trouvez : 


a) E(X) b) E(Y) c) EX+Y 
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21. 


22. 


23. 


24. 


25. 


26. 


27. 


Si l'on suppose que les trente élèves d'une classe constituent un choix 
parfaitement aléatoire d'une certaine population, quelle est la probabilité 
qu'au moins un élève appartienne au premier centile de la population en 
intelligence ? 


Un petit restaurateur emploie 3 serveurs. Il constate que les 5 dernières 
assiettes cassées accidentellement l'ont été par le même serveur, Louis 
Lacasse. Peut-il conclure que Louis est particulièrement maladroit ? 


Un marchand de parapluies peut gagner 400 $ par jour quand il pleut, et 
perdre 100 $ par jour s'il fait beau. Sachant qu'il y a 3 fois plus de beaux 
jours que de jours de pluie, quelle est son espérance de gain quotidien ? 


On retourne l'une après l'autre les 52 cartes d'un jeu ; quelle est la 
probabilité que le premier roi rencontré soit 

a) la 1re carte retournée. 

b) la 3° carte retournée. 


c) la 50: carte retournée. 


Dans une classe de maternelle composée de 15 garçons et de 10 filles, 
deux enfants sont choisis successivement au hasard pour représenter la 
classe à un concours. Calculez la probabilité : 

a) que 2 garçons soient choisis ; 

b) qu'une fille soit choisie en premier, un garçon en deuxième ; 

c) qu'un garçon soit choisi au 1% tirage ; 

d) qu'un garçon soit choisi au 2° tirage. 

D'un jeu de 52 cartes, on tire une 1° carte, puis une 2° sans remettre la 
1er dans le jeu. Évaluez les probabilités suivantes : 


» 


) P(1cre carte soit un as). 


(Cx 


) Piles 2 cartes soient un as). 


Q 


) P(au moins une des cartes soit un as). 
d) P(aucune des 2 cartes ne soit un as). 


On vous propose le jeu suivant : vous payez 2 $ pour tenter de deviner le 
résultat du lancer d'un dé équilibré. Si vous devinez correctement, on 
vous donne K $ plus votre mise ; sinon vous perdez votre mise. Quelle 
doit être la valeur de K pour que votre espérance de gain soit nulle ? 


28. 


29. 


30. 


31. 


32. 


33. 


34. 
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Soit À et C des événements indépendants. Si P(A) = 1/3 et P(C) = 1/5, 
calculez : 
a) PANO b) PAL CC) 


Soit À et B deux événements tels que P(A) = 0,4 et P(B) = 0,3. Déterminez 
P(A L B) pour chacune des hypothèses suivantes : 


a) PANB)=0,1 b) Aet B sont incompatibles 
c) P(A]|B) = 0,8 d) PAS Bi = 0,15 
e) B€CA 


Une boîte contient 2 billes noires et 3 blanches. On tire une bille à la fois 
(sans remise) jusqu'à ce qu'apparaisse une bille noire. Soit X le nombre 
de tirages requis. Trouvez E(X). 


Un solide a quatre faces, numérotées de 1 à 4. Sachant que P(l) = P(3) = p 

et P(2) = P(4) = 2p: 

a) Trouvez l'espérance mathématique de : X = Le nombre qui apparaît 
sur la face inférieure quand on lance le solide. 


b) Si vous lancez ce solide 2 fois et que vous notiez la somme des 
résultats obtenus, en identifiant les sous-ensembles suivants de Q : 

A = {somme paire}, B = {somme impaire}, C = {somme supérieure à 5}, 

évaluez : 

i) P(B) ïü P(ANB)  ïüi) P(Bc-A) iv) P(C|B) v) PBL OC) 
On suppose que le poids (en kg) des adultes se distribue avec une 
moyenne de 64 et un écart-type de 12. Soit X le poids total de 14 
personnes qui s'entassent dans un ascenseur. Calculez E(X) et 6x. 


Si l'on suppose que le poids, en grammes, des œufs est de moyenne 56 et 
de variance 20, quelle est l'espérance mathématique et la variance du 
poids d'une douzaine d'œufs ? 


Dans le problème précédent, si on place au hasard 6 œufs dans chaque 
plateau d'une balance, quelle est l'espérance et la variance de la 
différence de poids entre la première et la deuxième demi-douzaine ? 
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35. 


36 


*37. 


Une compagnie d'assurances offre une police d'annulation de voyage. La 
prime est de 25 $ par personne ; le coût pour la compagnie d'assurance 
est de 800 $ en cas d'annulation. Supposons que, d'après les 
statistiques, la probabilité qu'un client annule son voyage est de 0,02. 
Soit X le gain de la compagnie lorsqu'elle assure une personne (en 
négligeant tous les frais autres que le versement éventuel de 800 $). 


a) Calculez E(X) et Var(X). 


b) Soit X: et X2 les gains associés à deux clients et X = X, + X2 le gain 
total. Déterminez Var(X) si 


il) les deux clients sont étrangers l'un à l'autre ; 


ii) les deux clients appartiennent à la même famille, et une 
annulation entraîne automatiquement l'autre. (On suppose que la 
probabilité que le couple annule est 0.02.) 


. AU numéro précédent, supposons que le coût d'annulation C est 


variable, mais que la probabilité d'annulation demeure fixe à 0,02. La 
compagnie voudrait conserver en profit 30 % des primes recueillies. Quel 
pourcentage de C doit-elle exiger comme prime ? 


Un jury est formé de 3 juges. Les 2 premiers sont des juges honnêtes qui 
prennent la bonne décision avec probabilité p{p > 1/2). Le 3° juge prend 


sa décision au moyen d'un « pile ou face ». La décision du jury est prise à 


la majorité simple. Quelle est la probabilité que le jury prenne la bonne 
décision ? 
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Introduction Nous avons vu au chapitre 5 qu'il est possible de développer la 
fonction de masse d'une variable aléatoire particulière à partir des lois 
élémentaires des probabilités. Cette approche signifie que chaque nouveau 
contexte présente un problème nouveau que l'on résout indépendamment 
des autres. Or, il est évident que certains problèmes ont des similitudes 
entre eux qui font que la solution de l'un est solution de l'autre. On épargne 
beaucoup de temps et d'efforts en reconnaissant, dans un problème donné, 
une structure probabiliste déjà identifiée, car il suffit alors d'appliquer une 
solution déjà développée. 


C'est ce que nous ferons dans ce chapitre : nous identifierons des grandes 
classes de variables aléatoires et pour chacune nous développerons une 
fonction de masse générale. La fonction de masse sera exprimée à l'aide 
d'une formule mathématique, qui permet de passer d'une valeur de la 
variable à sa probabilité en effectuant un calcul relativement simple. Il est 
possible ainsi d'éviter les tableaux dans lesquels sont énumérées toutes les 
valeurs d'une variable et leur probabilité et qui, au chapitre 5, étaient notre 
seul moyen de présenter une fonction de masse. Nous donnerons, en outre, 
une expression pour la moyenne et la variance de chacune des lois étudiées. 


Avant d'aborder l'étude de ces lois nous présentons quelques notations qui 
seront utiles pour la suite. 


6.1 


FACTORIELLE ET COMBINAISONS 


Certaines des formules que nous utiliserons par la suite exigent qu'on 
calcule le produit des entiers 1, 2, 3, .…, n. Pour simplifier l'écriture, on 
représente ce produit par le symbole n!, appelé « factorielle n » : 


m=1x2x...x(n-1)xn. 


Par exemple, 
8l=1x2x3=-6, 
6=1x2x3x4x5x 6 = 720. 


Cette définition, évidemment, ne s'applique qu'aux entiers positifs. Ajoutons 
l'utile convention suivante : 


O! = 1. 


Exemple 1 
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Un autre calcul qui figure dans les formules de ce chapitre est celui 


n 


symbolisé par ( 2 et défini par 


Eee 


où xet n sont des entiers non négatifs et x< n. Par exemple, 


10. 


(5) 5! 5! 1x2x3x4x5 4x5 
3 31(5-3)! 312! (1x2x3)(1x2) 1x2 


La quantité à est appelée nombre de combinaisons de x objets parmi n. On 


trouvera, à la page 397, une table des nombres G: aussi appelés 


coefficients du binôme de Newton. L'ensemble de ces nombres forme le 


triangle de Pascal. La première ligne du tableau, correspondant à n = 0, 


0 


0) ; la deuxième, correspondant à n = 1, donne (il et (:) ; la 


donne k : 


troisième, correspondant à n = 2, donne (2), (2) et (2) : ainsi de suite. En 


général, pour n = O0, 1, .…, 20, le tableau donne (r), (r), Be (5) Chaque 
ligne du tableau peut être facilement calculée à partir de la ligne précédente 


en prenant les sommes des paires de nombres successifs, ainsi : 


n=7 Il 7 21 35 35 21 7 1 


n=8 1 8 28 56 70 56 28 8 Il 


À part le nombre 1 aux deux extrémités, chaque nombre dans la ligne n = 8 
est la somme des deux nombres situés juste au-dessus. Le lecteur peut 
vérifier qu'il obtiendra bien la ligne n = 9 à partir de la ligne n = 8 en 
utilisant la même technique. 

Il est intéressant de noter la signification des symboles n! et fa) dans la 


solution des problèmes de dénombrement. 


Le nombre n! représente le nombre de permutations de n objets. 


Combien y a-t-il de façons de placer 3 personnes, À, B, et C, sur un banc de 
trois places ? Le schéma suivant montre pourquoi la réponse est 3! = 6. 
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Exemple 2 


Première place Deuxième place Troisième place 


BB cç 
RE 


B 


œ 
> 


Il y a trois choix possibles pour la première place : À, B, ou C. Pour chacun 
de ces choix, il y en a deux pour la deuxième. Finalement, les occupants des 
deux premières places ayant été choisis, il ne reste plus qu'une seule 
possibilité pour la troisième. Donc, le nombre de permutations égale 3 x 2 x 
1, soit 3!. + 


La solution du problème de l'exemple 1 est clairement généralisable à 
n'importe quel nombre d'objets. 

Le nombre (r) représente le nombre de façons de choisir, sans tenir compte 
de l'ordre, x objets parmi n. Nous ne le démontrerons pas. 

Combien y a-t-il de façons de choisir, sans tenir compte de l'ordre, trois 
livres parmi six ? 


6 


Solution : On cherche la valeur de (5). Par la formule (" LÉ _. on obtient : 
6 6! 1x2x3x4x5x6 
3) 31(6-3)! (1x2x3)x(1x2x3) 


Cette valeur s'obtient aussi directement de la table des coefficients du 
binôme de Newton, à la case déterminée par les valeurs n = 6 et x = 3. Si les 
6 livres sont désignés par les lettres a, b, c, d, e et f, les 20 choix possibles 
de 3 livres sont : 


abc, abd, abe, abf, acd, ace, acf, ade, adf, aef, 
bcd, bce, bcf, bde, bdf, bef, cde, cdf, cef, def. + 
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6.2 


LOI BINOMIALE 


Considérons les quatre expériences aléatoires suivantes : 

a) On lance 20 pièces de monnaie et on obtient X « faces ». 

b) On lance 36 dés ; Y est le nombre de « 1 ». 

c) Il y a 10 naissances dans un hôpital ; U est le nombre de filles. 


d) 45 % des gens sont en faveur d'un projet de loi. Dans un échantillon de 
100 personnes choisies au hasard, on en trouve W qui sont en faveur du 
projet de loi. 


Ces quatre expériences aléatoires ont en commun un certain nombre de 
caractéristiques fondamentales : 


* chacune des variables X, Y, U et W peut être considérée comme étant le 
nombre de « succès » obtenus en un certain nombre n d'essais, 


* chacun des n essais a la même probabilité de donner un succès. 


Une autre caractéristique fondamentale - parfois évidente, parfois pas - est 
la suivante : 


+ les essais sont indépendants. 


Ces caractéristiques communes sont assez fondamentales pour que les 
variables X, Y, U et W, malgré leurs différences superficielles, aient un 
comportement probabiliste de même type. On dit qu'elles sont toutes de 
même loi, la loi binomiale. Leurs fonctions de masse ne sont pas identiques, 
mais nous verrons plus bas qu'elles sont de même forme. Elles se 
distinguent l'une de l'autre par la valeur de deux quantités appelées des 
paramètres : 


n : le nombre d'essais, et 
p : la probabilité, à chaque essai, d'obtenir un succès. 


Une variable qui représente le nombre de succès obtenus lors de n essais 
indépendants est de loi binomiale avec paramètres n et p, notée B(n, p). 


Vérifions les conditions qui définissent la loi binomiale dans chacun des 
exemples ci-dessous. 
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a) 


Le nombre X de « faces » en 20 lancers d'une pièce de monnaie. Il y a 
n = 20 essais, le succès est « obtenir face », la probabilité d'obtenir « face » 
est p = 1/2. 


L'indépendance des épreuves ici est indiscutable : il suffit de réaliser que 
le fait d'avoir eu, disons « face », à un certain essai n'a aucun effet sur la 
probabilité d'avoir « face » au prochaïn. On dit alors que X est de loi 
B(20, 1/2). 


Le nombre Y de « 1 » en 36 essais. Ici n = 86, le succès est « obtenir « 1 », 
la probabilité de succès est p = 1/6. L'indépendance est ici aussi 
évidente. Alors Y est de loi B(36, 1/6). 


Le nombre U de filles parmi 10 nouveaux-nés. Il y a n = 10 essais, le 
succès est « avoir une fille », et la probabilité de succès est, d'après les 
statistiques, voisine de p = 0,487. Il est presque certain que les essais 
sont indépendants, à la seule condition qu'il n'y ait pas de jumeaux 
homozygotes dans l'échantillon. U est de loi B(10; 0,487). En pratique, on 
utilisera souvent la loi B(10; 0,5) comme approximation. 


Le nombre W de personnes en faveur du projet de loi dans un échantillon 
de 100 personnes. Si l'on envisage l'échantillonnage comme une 
succession de 100 tirages dans la population, alors il y a n = 100 essais, 
le succès est « la personne choisie est en faveur du projet de loi », et la 
probabilité de succès est p = 0,45 à chaque tirage. L'indépendance des 
épreuves n'est vérifiée que si les tirages sont effectués avec remise. Si les 
tirages se font sans remise, chaque tirage modifie la composition de la 
population et donc réduit ou augmente la probabilité de succès aux 
essais suivants. La variable W n'est alors plus de loi binomiale. Toutefois, 
lorsque la population est très grande, la dépendance entre les épreuves 
est très faible et la loi binomiale peut alors être utilisée comme 
approximation. 


Fonction de masse La fonction de masse p(x d'une variable aléatoire X de loi 
B(n,p) est donnée par la formule 


p(x) = (" }° (—-p})"" pourx=0,1,2,...,n. 


Avant de justifier cette formule, nous donnons un exemple pour illustrer son 
application. 


Exemple 3 


Exemple 4 
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Un archer atteint la cible avec une probabilité de 60 %. Il tire 7 flèches. 
Tracer le diagramme à bâtons de la fonction de masse p{x où X représente le 
nombre de coups au but. 


X est de loi B(7; 0,6). Par la formule donnant p(x on obtient 


7! 
p(0)=——(0,6)°(0,4)/ =1x0,001 638 4 = 0,001 638 4 
o17! 
7! 
p(1)=——(0,6)'(0,4)° =7x0,002 457 6 = 0,017 203 2 
116! 
7! 5 : 
p(2)=——(0,6)° (0,4)° =21x0,003 686 4 = 0,077 414 4 
215! 
7! 3 4 
p(3)=——(0,6)° (0,4)* = 35x0,005 529 6 = 0,193 536 O 
314! 
7! 
p(4)=——(0,6)* (0,4)° = 35x0,008 294 4 = 0,290 304 0 
413! 
7! 
p(5)=——(0,6)° (0,4) =21x0,012 4416 = 0,261 273 6 
512! 
7! 
p(6)=——(0,6)° (0,4) =7x0,018 662 4 0,130 636 8 
611! 


7! 
p(7)=——(0,6)" (0,4)° =1x0,027 993 6 = 0,027 993 6. 
710! 


Cette fonction de masse est illustrée dans la figure 6.1. + 


Justification de la formule Avant d'aborder le cas général où n et p prennent 
des valeurs quelconques, considérons en détail le cas particulier où n = 4 et 


Pp=1/5. 


On suppose que, dans un certain magasin, un client sur trois paye au 
moyen d'une carte de crédit (et 665% des clients payent d'une autre façon : 


argent comptant, chèque, etc). Quatre clients sont en ligne à la caisse. Soit X 
le nombre de clients qui, parmi eux, utiliseront une carte de crédit. 


Cette variable X est de loi B(4,1/3) car on peut aisément la visualiser comme 
étant le nombre de succès obtenus en 4 essais indépendants avec, à chaque 
fois, une chance sur 3 d'avoir un succès. 
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Fonction de masse d'une variable B(7; 0,6) 
P(X 


0,3 


0,2 


Fréquence 


0,1 


+ 


Les valeurs possibles pour X sont évidemment les entiers O, 1, 2, 3 et 4. Il 
reste à déterminer la probabilité de chacun de ces résultats. C'est ce que 
nous ferons en considérant au long tous les résultats expérimentaux 
possibles, c'est-à-dire, tous les éléments de l'espace échantillon. 


Notant par les lettres S (succès : carte de crédit) ou E (échec : pas de carte de 
crédit) les résultats successifs obtenus à chacun des 4 essais ; on voit que 
les 16 éléments de l'espace échantillon correspondent aux 16 « mots » de 4 
lettres qui peuvent être formés en utilisant uniquement les lettre $S et E. Le 
tableau 6.1 donne la liste de ces 16 mots, la probabilité de chacun, ainsi que 
la valeur de X (le nombre de S) qui lui est associée. 


Dans le tableau 6.1, la probabilité d'un mot est calculée en multipliant les 
probabilités des résultats qui le composent. L'indépendance des essais 
justifie ces calculs. 


Il est maintenant aisé de calculer la probabilité de chacune des valeurs 
possibles pour X en effectuant la somme des probabilités de chacun des 
mots qui donnent cette valeur de X. 


Par exemple, la valeur X = 3 est obtenue de quatre mots différents (SSSE, 
SSES, SESS et ESSS) et la probabilité de chacun de ces mots est de 2/81. 
On obtient donc : 


pie 4 
p(3)=P(X=3)=4%x 0,098 8. 
81 81 


TABLEAU 6.1 
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Les 16 résultats possibles avec n = 4 et p = 1/3 


Mot Probabilité du mot X 
nr + eat o 4 
SSSE iktxlxiet ñ 
SSES ixlxixts2 à 
EE sata ei 2 
SESS Lrixixls2 à 
SE aa 0 2 
SEES trixixtet . 
SÉEE Lrixixie À ; 
ESSS Sxlxlxls2 - 
ESSE 2xtxtx2e > 
ESES 2xtxixte . 
ESEE Fxtxix ie ; 
Sue be er 2 
EESE Fxixlx is j 
EEES Fxixixte ; 


De même, on trouve : 


16 32 24 8 1 
p(0)=——,p(1)=—,p(2)=—, p(8)=— et p(4)=—. 
81 81 81 81 81 


La distribution de X est illustrée par un diagramme à bâtons (figure 6.2). + 


Dans l'exemple qui vient d'être présenté, il a été possible de calculer les p(x) 
en considérant individuellement chacun des 24 = 16 cas possibles. Si l'on 
avait eu n = 10, le nombre de cas à considérer aurait été 219 = 1 024. Avec 
n = 20, on en aurait eu plus d'un million ! On conviendra aisément qu'il est 
hors de question d'utiliser pareille méthode de calcul pour des valeurs de n 
qui sont le moindrement élevées. Il serait commode de pouvoir employer une 
formule qui permette de calculer directement les p(x sans qu'on ait à remplir 
le tableau, souvent monstrueux, des 2” cas possibles. 
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FIGURE 6.2 


Exemple 5 


Considérons de nouveau le tableau 6.1. On constate que, pour des valeurs 
quelconques de n et de p, chaque mot formé de x lettres S et (n - x lettres E 
est obtenu avec une probabilité toujours égale à p*{1 — p}"-x. Pour calculer 
pl, il suffira donc de savoir dénombrer le nombre de mots formés de 
xlettres S et (n - x lettres E, c'est-à-dire le nombre de façons de choisir 
x espaces parmi n, les x espaces choisis recevant les x lettres S et les (n — x 
espaces qui restent recevant des E. Or, ce nombre de façons de choisir x 


espaces parmi n est précisément ce qui est évalué par le coefficient ) du 


binôme de Newton. 
Fonction de masse d'une variable B(4,1/3) 


32/81 
8/27 
16/81 


8/81 


Si une variable X est de loi B(n, p), il y a, comme on vient de le voir, (r) mots qui 


conduisent à X = x. Chacun de ces mots ayant une probabilité p“{1 - p}'-*x on 
obtient donc : 


pCO = (7 jp*q"* pour x=0,1,2,..,n 


où, pour alléger les notations, on a posé 1 - p = q. Il convient de rappeler que 
p=æp=l. 


On lance 10 sous et on appelle X le nombre de « faces » obtenues. 
Déterminer la fonction de masse p(x. 


Ici, X est de loi B(10, 1/2). On a donc, pour x= O0, 1, 2, .….. 10, 


TDIOIORHIOENE 
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Le tableau des coefficients du binôme de Newton donne donc : 


1 10 45 120 
p(0)= > P(D = ; P(2)=—, p(3)=—, 
1024 1024 1024 1024 
210 252 210 120 
p(4) = —, P(5)=—, p(6) = ; p(7)= , 
1024 1024 1024 1024 


45 10 
POISSONS ES POV; 
1024 1024 1024 
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Exemple 6 Dans une manufacture, on inspecte les lots d'articles produits en série en 
utilisant des méthodes d'échantillonnage. Dans chaque lot, dix articles sont 
choisis au hasard et le lot est rejeté si 2 articles ou plus sont défectueux. Si 
un lot contient exactement 5 % d'articles défectueux, quelle est la probabilité 


que le lot soit accepté ? Refusé ? 
Dans cet exemple, X est B(10; 0,05) et le lot est accepté si X = O ou 1. 
La probabilité que le lot soit accepté est donc : 
P(lot accepté) = p(0)+p(1) 

= (Hi X0,05)° (0,95)'° + (19 X0.05)° (0,95)° 

= 0,598 74 +0,315 12 = 0,913 86. 
La probabilité que le lot soit refusé est donnée par 

P(lot refusé) = p(2)+p(3)+...+p(10) 
=1-p(0)- p(1) 


=1-0,913 86 
= 0,086 14. 
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Espérance mathématique et variance d'une variable binomiale Comme on l'a vu 
au chapitre 5, l'espérance mathématique d'une variable aléatoire s'obtient en 
calculant 


=> x;p(x;). 
Appliquant cette formule aux résultats numériques obtenus dans l'exemple 
3, où X est B(7; 0,6), on obtient 
u = (0 x 0,001 638 4) + (1 x 0,017 203 2) +... + (7 x 0,027 993 6) = 4,2. 


Était-il nécessaire de calculer au long chacun des p{x) pour connaître pi ? 
Heureusement, non. Le résultat 1 = 4,2 s'obtient directement du produit 
nxp = 7 x 0,6 = 4,2. On admettra facilement que si chaque essai a une 
probabilité p de donner un succès, alors, en n essais, on s'attend à obtenir 
environ n x p succès. C'est là la valeur attendue pour X, son espérance 
mathématique. 


De même, il est possible de trouver une expression particulièrement simple 
pour la variance o? d'une variable de loi binomiale. Rappelons qu'en général, 
la définition de la variance est 


5? => (x; -u)*p(x;) 
ce qui donne, pour la variable de l'exemple 3, 
o?=(0-4,2)? x0,001638 4+...+(7-4,2)? x0,027 993 6 = 1,68 
Le même résultat s'obtient avec la formule 
oc? =npq=7x0,6x0,4 = 1,68. 


Nous avons donc les résultats généraux suivants : 


Si X est B (n, p), alors 


E(X)=u=np et Var(X)=0?=npq. 


Justification de la formule La formule pour la variance, o? = npq (où q = 1 -p), est 
plus malaisée à justifier que celle pour la moyenne. On peut, bien sûr, la 
démontrer algébriquement en développant l'expression 


S2= D 0x-u)? p00 = en}? (r )p'g"*. 
x=0 x=0 


Exemple 7 
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Une preuve plus simple peut cependant être obtenue en remarquant que le 
nombre X de succès obtenus en n essais peut s'exprimer sous la forme 
X=X: + X2 + TX 


où x; vaut O ou 1 selon que le i-ième essai a donné un échec ou un succès. 
Puisque chacun de ces X vaut O ou 1 avec des probabilités respectives de q 
et p, on trouve aisément que 


E(X,)=(0xgq)+(1xp)=p 
et 
Var(X,)=(0-p)° xq+(1-p)° xp 
= p?(1-p)+p(1-p)° 
=p(i-p}(p+1-p) 
= p(1-p)= pq. 


Utilisant le fait, vu au chapitre 5, que l'espérance d'une somme de variables 
aléatoires est la somme des espérances de ces variables, on obtient 


E(X)=E(X,+X,+..+X,)=E(X,)+E(X,)+..+E(X,) 
=p+p+...+p=np. 


Étant donné que les essais sont indépendants, les variables X1, .…., X, sont 
indépendantes, et puisque la variance d'une somme de variables 
indépendantes est la somme des variances de chacune des variables, on 
obtient 


Var(X)=Var(X,+X,+..+X,)=Var(X,)+Var(X,)+...+Var(X,) 
= pq +pq+...+pq = npq. 


On suppose que, dans la population d'une grande ville, 30 % des gens sont 
partisans d'une certaine option politique. Lors d'un sondage auprès de 1 000 
personnes, X personnes se déclarent en faveur de ce parti politique. 
Déterminer E{X) et Var(X). 


Les épreuves ne sont pas strictement indépendantes, puisque les tirages ne 
se font pas généralement avec remise. Cependant, il s'agit d'une grande ville 
et d'un échantillon relativement petit. Donc, l'effet d'un tirage sur la 
population est négligeable, la variable X ici considérée est à peu près de loi 
B(1 000; 0,3), 


194 Introduction à la statistique appliquée 


E(X) = u = np = 1000 x0,3 = 300 
Var(X) = 6 ? = npq = 1000 x 0,3 x 0,7 = 210 
et l'écart-type © vaut V210 = 14,49. 


Serait-il surprenant d'obtenir X > 350 ? Bien sûr, puisque 350 se situe à 
plus de 3,4 écarts-types à droite de u, ce qui est vraiment exceptionnel. 


6.3 


Exemple 8 


LOI HYPERGÉOMÉTRIQUE 


Supposons qu'on prélève un échantillon de taille n d'une population de N 
individus, dont une proportion p possède une certaine propriété. Notons par 
X le nombre d'individus, dans l'échantillon choisi, qui ont la propriété 
considérée. Alors X est de loi B{n,p)}, à condition que les tirages soient 
indépendants. Les tirages sont indépendants s'ils sont faits avec remise ; et 
ils sont à peu près indépendants s'ils sont faits sans remise mais dans une 
population beaucoup plus grande que l'échantillon. 


Supposons, cependant, que la population n'est pas incomparablement plus 
grande que l'échantillon. La loi binomiale ne peut plus être appliquée. Une 
autre loi, appelée loi hypergéométrique, s'applique dans ce cas. Nous 
commençons par un exemple qui illustre un cas particulier de la loi 
hypergéométrique. 


Une petite classe est composée de 5 filles et 3 garçons. On tire, au hasard, 
quatre étudiants et on note par X le nombre de filles dans cet échantillon. 


Calculer P(X = 2). 


Nous pouvons résoudre ce problème en utilisant les techniques de 
dénombrement. Considérons l'ensemble Q de tous les résultats possibles ; il 
est raisonnable de supposer que les résultats sont équiprobables. Par 
conséquent, la probabilité de l'événement {X = 2}, que nous noterons À, est 
calculée en divisant le nombre d'éléments dans À par le nombre d'éléments 
dans Q. Puisque Q est l'ensemble de tous les échantillons de taille 4 tirés 
d'une population de taille 8, il contient (5) = 70 éléments. L'événement À est 


l'ensemble de tous les échantillons formés de 2 filles et 2 garçons. Le nombre 


de façons de choisir les deux filles est (5) = 10 ; pour chacun des 10 choix de 


deux filles, il y a (3) = 3 façons de choisir les 2 garçons. Il y a donc 10 x 3 = 


30 façons de choisir 2 filles et 2 garçons. Donc P(A) = 3%, = 3%. + 
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Le cas général se résout de la même façon. Une population contient N 
éléments, dont MN appartiennent à une certaine catégorie, disons la catégo- 
rie 1. Si l'on note par NM le nombre d'individus qui n'appartiennent pas à la 
catégorie 1, alors 


N= N: + Nb. 
La proportion des individus qui appartiennent à la catégorie 1 est 


p=— 
N 
Si X est le nombre d'individus qui appartiennent à la catégorie 1 dans un 
échantillon de taille n, alors on dit que X est de loi hypergéométrique (X 


est Hpg{n, Ni, N)). 


On voit aisément que : 


X<n car on ne tire que nindividus. 

X<NM car seulement N; individus ont la propriété voulue. 
X20 car X ne peut être négatif. 

X>n-M car n- X< M ; le nombre d'individus tirés n'ayant pas 


la propriété voulue ne peut être supérieur à M. 


Par un raisonnement semblable à celui présenté dans l'exemple 8, on 
obtient : 


si X est Hpg{n, N:, NM), alors 
Ce) 
pOX)= TT pour max {0,n-N, }< x < min{n,N. k 


n 


Remarque I n'est pas nécessaire de vérifier les conditions max{0, n - Ni} < x 
< minin, Ni}, car dès que x sort de cet intervalle, la formule pour p(x) prend 


automatiquement la valeur zéro. Par exemple, si N1, = 5 et x = 6, le terme 
é }= (5 k au numérateur de la formule, est égal à zéro, puisqu'il n'y a aucune 


façon de choisir 6 objets parmi 5. 
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Exemple 9 


Un calcul algébrique un peu plus poussé permet de montrer que : 


si X est Hpg{n, MN, N), alors 


N-n 
E(X)=np Var(X) = npq —— 
N 


4 1 N, 
où p= et q=1-p= j 
N 


Un bloc d'habitation, composé de 16 logements, est mis en vente. L'actuel 
propriétaire prétend que seulement 4 de ces logements ont un système 
électrique défectueux. Un client éventuel, voulant vérifier cette affirmation, 
fait inspecter 5 logements choisis au hasard. Dans 3 d'entre eux, on trouve 
que le système électrique est à refaire. Le propriétaire a-t-il 
(vraisemblablement) menti ? 


Si le propriétaire a dit vrai, le nombre X de logements avec installations 
électriques défectueuses, parmi les 5 logements visités, devrait suivre une loi 
Hpg{5, 4, 12). 


La formule de la fonction de masse donne : 


792 1980 320 264 
p(0) = > p(1) = ° P(2)= ——, p(3) = > p(4) = 
4 368 4 368 4 368 4 368 4 368 
La valeur X = 3 expérimentalement obtenue est passablement grande. En 


26 L 0,063 2. 


fait, on trouve que P(X2 3) = 53 


Il semble bien que le propriétaire ait menti car la probabilité est bien faible 
d'obtenir une aussi grande valeur de X. 
On aurait pu se contenter de calculer simplement 

u = np = 1,25 et o° = npq(N - n)(N- 1) = 0,687 5 (o = 0,829 2). 


La valeur observée, X = 3, étant située à 2,11 fois l'écart-type à droite de u 
peut être jugée significativement grande et conduire à la conclusion que le 
propriétaire a apparemment menti. + 
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6.4 


LOI GÉOMÉTRIQUE 


Aux sections 6.2 et 6.3, nous avons considéré des expériences constituées 
d'un nombre fixe d'essais, chaque essai pouvant donner un succès avec 
même probabilité p. La variable aléatoire X est le nombre de succès. Ici, nous 
considérons une expérience constituée d'une série d'épreuves indépen- 
dantes, mais où c'est le nombre d'épreuves qui est aléatoire et non le nombre 
de succès. L'expérience consiste à répéter les essais jusqu'à ce qu'un premier 
succès soit obtenu. 


Si l'on désigne par X le nombre d'essais effectués pour obtenir ce premier 
succès, cette variable X est dite de loi géométrique : X est Géom{(p). 


La fonction de masse d'une variable de loi géométrique est aisément 
développée. Si x est un entier positif, l'événement {X = x se réalise si et 
seulement si les x - 1 premiers essais ont produit des échecs et le x-ième a 
produit un succès. En d'autres termes, p(x) est la probabilité du résultat 


EEEE...EES 
De 


x-1 fois 
La probabilité d'un tel résultat est 


qaxqxqxqx….gxqxp=q""p, 


x-1 fois 


où 
q=1-p. 


Nous avons donc le résultat suivant 


si X est Géom(p), alors 


1 


p(x)=pq*" pour x=1,2,3,... 


Il est possible dans le cas de la loi géométrique de déterminer une formule 
donnant la probabilité des événements {X > x et {X < x%. L'événement {X > x 
se produit si et seulement si les x premiers essais ont conduit à des échecs. 
Par conséquent, 


P(X>x)=q" 
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Exemple 10 


FIGURE 6.3 


et donc 
P(X<x)=1-P(X > x)=1-q". 


Il n'est pas aussi facile d'établir les formules pour l'espérance et la variance 
d'une variable de loi géométrique. Ainsi nous les donnons sans justification : 


si X est Géom(p), alors 


P(X >x)= gq* pour x =1,2,3,.. 


Gr: 


1 
H=—, 
p p 


Une compagnie pétrolière effectue des forages. On suppose que chaque puit 
creusé a une chance sur 5 de donner du pétrole. Si l'on désigne par X le 
nombre de puits qui doivent être creusés pour obtenir (enfin !) un « hit », 
tracer le diagramme à bâtons de p(x et calculer P(X > 7). Déterminer aussi 
E(X) et Var(X). Dans cet exemple, X est de loi Géom(1/5). Pour x = 1, 2, 3, …, 
on a donc p{x) = Lx (Se 1, 

p(1)=0,2 p(2)=0,16 p(3)=0,128 p(4)=0,1024 p(5)=0,08192 p(6)=0,065 536, … 

P(x>7)=(0,8) =0,209 715 2. 


Aussi, par les formules appropriées, 


E(X)=u=i=5, Var(X)=6° = =20 et o = 420 =4,472. 


= 
Fonction de masse d'une loi Géom(1/5) 


02 (7 


0,1 


0 1 23 4 5 6 7 8 9 10 11 12 13 14 … 
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Chaque bâton a une hauteur égale à 80 % de celle du bâton qui le précède ; 
les hauteurs des bâtons forment donc une progression géométrique, d'où le 
nom donné à cette loi de probabilité. + 


Remarque Pour que le modèle géométrique puisse s'appliquer au dernier 
exemple, il faut que les lieux de forage soient suffisamment éloignés les uns 
des autres pour qu'on puisse raisonnablement supposer que les résultats des 
forages sont indépendants. Si on effectue tous les forages au même site, 
l'indépendance de leurs résultats est loin d'être assurée et la loi géométrique 
ne convient plus à la description du comportement de la variable X. 


6.5 


Exemple 11 


LOI DE POISSON 


Il arrive fréquemment qu'on ait à considérer le nombre d'événements qui se 
produisent, non pas en un nombre fixe d'essais (ce qui relève de la loi 
binomiale) mais plutôt durant un certain intervalle de temps. Par exemple, le 
nombre d'appels téléphoniques reçus par un standardiste entre 10 heures et 
11 heures ; ou encore le nombre de crevaisons subies par une flotte de taxis 
durant une certaine semaine ; ou le nombre de particules émises, en une 
seconde, par une substance radioactive. C'est alors la loi de Poisson, plutôt 
que la loi binomiale, qui s'applique. 


Une variable aléatoire X suit une loi de Poisson avec moyenne À (lambda) 
si sa fonction de masse est 


FAX 


p(x) = pour x =0,1,2,3,... 


x! 


où e est une constante mathématique fondamentale voisine de 2,718 28. 


Une compagnie d'assurances reçoit, en moyenne, 4,2 réclamations par jour. 
Déterminer la probabilité que, durant une certaine journée, le nombre de 
réclamations reçues soit inférieur ou égal à 2. 


Solution : Nous supposons que X, le nombre de réclamations reçues, suit 
une loi de Poisson avec moyenne À = 4,2 (X est Poisson(4.,2)). 
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Exemple 12 


On trouve donc que 
P(X<2)=p(0)+p(1)+p(2) 
_12((4:2)° (4,2)! (4,2) 
=e + + 
0! 1! 2! 


= 0,210 24 


La loi de Poisson ne s'applique pas uniquement au nombre d'événements 
dans un intervalle de temps. L'exemple suivant montre qu'il peut être 
question d'espace aussi bien que de temps. 


Un dactylographe fait, en moyenne, 2 fautes de frappe par page de texte 
dactylographié. Il vient de taper un texte qui couvre 1,5 page. Quelle est la 
probabilité que le texte contienne moins de 2 fautes ? 


Le nombre moyen de fautes attendu sur un texte de 1,5 page est À = 3. 
Utilisant la loi de Poisson, on trouve 


0 1 


pc <2) pente | k Joe + 
0! 1! 


Pour connaître la distribution d'une variable aléatoire qui suit une loi de 
Poisson, il suffit de connaître sa moyenne u = À. La variance o? s'obtient 
aussi directement de À. 


Si X est de loi Poisson(A), alors 


E(X)=2x et Var(X)=1. 


Dans les deux exemples précédents, le choix de la loi de Poisson a été fait de 
façon plutôt désinvolte. Les conditions dans lesquelles la loi de Poisson 
s'applique ne sont pas toujours évidentes. Pour mieux décrire ces conditions 
nous ferons d'abord un rapprochement avec la loi binomiale. 


Approximation de la loi binomiale par la loi de Poisson La loi de Poisson est 
souvent présentée comme un cas limite de la loi binomiale ; c'est le cas où n 
augmente indéfiniment (tend vers l'infini) alors que p diminue (tend vers O) 
simultanément, de telle sorte que le produit À = np demeure fixe. Dans ces 
conditions, on peut démontrer que la loi binomiale tend vers la loi de 
Poisson. Cette notion de convergence d'une binomiale nous permettra plus 
bas de cerner les conditions qui permettent l'emploi de la loi de Poisson. 


Exemple 13 


6 Quelques lois discrètes 201 


Toutefois, cette loi a une application plus immédiate : si n est grand et p 
petit, alors une variable de loi B{n, p) est approximativement de loi de 
Poisson(À) où À = np. Ceci nous permet de remplacer la formule 


(° Jp” (-p)"" 
par 


e 37 


X! 
avec À = np lorsqu'on calcule P(X = x). 


On suppose que 3 % des appareils fabriqués par une certaine compagnie 
sont défectueux. Appelons X le nombre d'appareils défectueux dans un lot de 
60 appareils choisis au hasard dans la production. 


En toute rigueur, X est de loi B(60; 0,03) et, pour x = 0, 1, …, 60, p(x 
s'obtient par la formule p(x) = (so X0.03)* (0,97) *. 


On obtient p(0) = 0,160 8 ; p(l) = 0,298 4; p(2) = 0,272 3 ; p(3) = 0,162 8; 
P(4) = 0,071 7 ; p(5) = 0,024 9 ; p(6) = 0,007 0 ; p(7) = 0,001 7 ; p(8) = 0,000 3; 
p{(9) = 0,000 1 ; etc. 


Puisque p = 0,03 est petit et n = 60 est assez grand, la loi de Poisson{(\) avec 
À = np = 1,8 donnera, par la formule p{x = e-18(1,8)*/x, des probabilités très 
voisines des valeurs exactes obtenues de la loi binomiale. L'utilisation de la 
loi de Poisson (1,8) donne : 


P(0) = 0,165 3 ; p(l) = 0,297 5 ; p(2) = 0,267 8 ; p(3) = 0,160 7 ; p(4) = 0,072 3 ; 
P{(S5) = 0,026 0 ; p(6) = 0,007 8 ; p(7) = 0,002 0 ; p(8) = 0,000 5 ; p(9) = 0,000 1; 
etc. + 


Conditions d'applications de la loi de Poisson Une façon de justifier en 
pratique la supposition qu'une variable X est de loi de Poisson consiste à 
montrer que X peut être considérée comme une variable de loi binomiale 
avec n très grand et p très petit. Voyons ce que ceci implique dans un 
contexte particulier. Nous avons dit, par exemple, que le nombre X d'appels 
reçus par un standardiste entre 10 heures et 11 heures est de loi Poisson. 
Pour interpréter X comme une variable binomiale, découpons l'intervalle de 
10 à 11 heures en un grand nombre de sous-intervalles, disons les 3 600 
secondes de l'heure. Considérons ces 3 600 secondes comme 3 600 essais, 
chacun avec deux résultats possibles : il y a eu un appel (succès) et il n'y a 
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pas eu d'appel (échec). Dans ce cas, le nombre d'appels X est le nombre de 
succès en n = 3 600 essais. Si les essais sont indépendants, et si la 
probabilité d'avoir plus d'un appel dans un sous-intervalle est négligeable, 
alors X est à peu près de loi binomiale. Le nombre d'essais est grand et on 
aurait pu le choisir plus grand encore. Si l'on choisit des intervalles plus 
courts, chose qu'on peut faire à volonté, on augmente n et diminue p 
simultanément - ce sont précisément les conditions dans lesquelles la loi 
binomiale approche la loi de Poisson. 


Ainsi donc, nous concluons que le nombre d'appels reçus dans une heure 
est une variable de loi de Poisson, à condition que les suppositions que nous 
avons faites soient raisonnables. Malheureusement, nous ne savons pas 
toujours si elles le sont. Est-il légitime de supposer que les essais sont 
indépendants ? Et que chacun d'eux n'a que deux résultats possibles ? Le 
contexte peut rendre chacune de ces hypothèses plus ou moins plausible, 
mais rarement certaine. Lorsqu'il s'agit d'appels téléphoniques, on peut 
sûrement supposer que la probabilité de plus d'un appel dans un intervalle 
assez petit est négligeable. Cette supposition n'est toutefois pas raisonnable 
lorsque les événements peuvent survenir simultanément. Ainsi le nombre 
d'accidents dans une ville est peut-être de loi de Poisson, mais le nombre de 
personnes impliquées dans des accidents ne l'est pas : un même instant peut 
produire plusieurs victimes. 


De même, l'hypothèse d'indépendance ne peut pas être faite à la légère. Les 
arrivées chez un marchand de journaux sont-elles indépendantes ? Parfois, 
mais on peut facilement imaginer des causes possibles de dépendance : une 
personne qui arrive peut être suivie de ses compagnons ; ou certaines 
arrivées peuvent en décourager d'autres si le marchand a des concurrents à 
côté ; ou encore on peut avoir des arrivées massives dues à l'arrêt d'un 
autobus ou à la fermeture d'un bureau. Il y a aussi les cas où les 
événements apparaissent selon un rythme régularisé, comme, par exemple, 
les passages des autobus. Les passages des taxis, moins régularisés que 
ceux des autobus, se prêtent mieux à l'application de la loi de Poisson. 


Nous avons supposé, dans les exemples ci-dessus que l'intensité du 
processus (le nombre moyen d'événements par unité de temps) demeure 
constante. Nous avons négligé les phénomènes du type « heure de pointe ». Il 
peut toutefois se présenter des problèmes où il serait incorrect de ne pas 
tenir compte des variations dans l'intensité du processus. Par exemple, le 
nombre moyen de véhicules qui, par minute, traversent un certain pont est 
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sûrement plus élevé aux heures de pointe (8 heures et 17 heures) qu'au 
milieu de la nuit. Si l'intensité n'est pas constante, le calcul du nombre 
attendu d'événements dans un intervalle de temps donné peut se révéler 
assez délicat. 


RÉSUMÉ 


: Valeurs s 
Loi ; p{x) H (9 
possibles 
B(n, p) 0,1,2,...,n hi l*q"* np npq 
PA NNS O<x<n du 1e ” Lt 

x-1 L q 
Géom(p) 42:35: pq” A 7 
p p 

hs x 

À 
Poisson(à) 0, 1,2, 3, : à j 


Loi binomiale (B{n, p)) : X est le nombre de succès obtenus en n essais 
indépendants où p représente la probabilité d'un succès, à l'un quelconque 
des essais. 


Loi hypergéométrique (Hpg(n, MN, N)) : Une population est formée de M, 
individus de type I et M individus de type II. X est le nombre d'individus de 
type I obtenus dans un échantillon de taille n (parmi tous les N = M + M 
individus). 


Loi géométrique (Géom(p)) : X représente le nombre d'essais nécessaires à 
l'obtention d'un premier succès. 


Loi de Poisson (Poisson(i)) : X est le nombre d'événements qui se produisent 
durant un certain intervalle de « temps ». 


204 Introduction à la statistique appliquée 


EXERCICES 


FACTORIELLE 
T 


COMBINAISONS 


LOI BINOMIALE 


1. 


œ 


Calculez 


a)5! b)7! c)8! d)10! 
Calculez 


40] 9) (ef) 9[2) 


De combien de façons cinq personnes peuvent-elles s'asseoir sur une 
banquette d'autobus ? 


Combien de « mots » de 6 lettres peut-on former en permutant les lettres 
A-B-C-D-E-F ? 


De combien de façons peut-on choisir trois personnes parmi 8 ? Si les 
trois personnes doivent constituer un comité formé d'un président, un 
secrétaire et un trésorier, de combien de façons peuvent-elles être 
affectées à ces postes ? 


De combien de façons peut-on choisir 3 nombres distincts parmi les 
nombres entiers 1,2, .…, 49 ? 


Un groupe de 11 personnes doit être séparé en deux groupes, le premier 
de 5 personnes, le second de 6. Combien y a-t-il de façons de former le 


premier groupe ? Le deuxième groupe ? Vous devriez constater dans cet 
11 


ss }, et comprendre pourquoi en général, (") = u ]. 


n—x 


: IH | 
exercice QUE ( ] ( 


On lance 5 pièces de monnaie et on observe le nombre X de faces 
obtenues. 


a) Dressez la liste des 32 éléments de Q et déterminez la valeur de X 
associée à chacun de ces résultats. 


b) Représentez la fonction de masse p(x au moyen d'un diagramme à 
bâtons. 


Soit X une variable aléatoire B(5, 1/3). Calculez 


a) P(X = 2) b) P(X > 3) 


11 


12. 


15. 
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a) On tire avec remise 4 personnes d'une population dont 20 % sont 
gauchers. Quelle est la probabilité qu'exactement 2 soient gauchers ? 


b) On lance un dé 5 fois. Quelle est la probabilité d'avoir 4 fois un 
nombre supérieur à 4 ? 


c) On tire avec remise 10 boulons d'une caisse qui contient 100 boulons 
dont 10 sont défectueux. Quelle est la probabilité que 9 des 10 
boulons tirés soient défectueux ? 


. On lance une pièce de monnaie équilibrée 4 fois et X représente le 


nombre de piles. 
a) Déterminez la fonction de masse de X. 
b) Calculez la probabilité d'avoir au moins 3 piles. 


À cause d'un certain défaut génétique, une femme sait qu'à chacun de 
ses accouchements prochains la probabilité que son enfant soit sain 
n'est que 3/4. Elle se demande quelle est la probabilité que sur 5 
grossesses elle ait exactement 3 enfants sains. Calculez cette probabilité 
en suivant les étapes suivantes : 


a) Énumérez les éléments de l'espace échantillon sous forme de 
quintuplets du genre (S, M, M, S, M), où S signifie « sain » et M 
signifie « malade ». 


b) Les résultats énumérés dans l'espace échantillon sont-ils 
équiprobables ? 


c) Quelle est la probabilité du résultat (S, S, S, M, M) ? 


d) Cette probabilité est-elle la même pour tous les cas favorables à 
l'événement « 3 enfants sont sains » ? 


e) Combien y a-t-il de cas favorables à l'événement « 3 enfants sont 
sains » ? 


f) Quelle est la probabilité que 3 des 5 enfants soient sains ? 


La probabilité qu'un radar détecte un avion ennemi est 0,9. Si cinq de 
ces radars sont disponibles, quelle est la probabilité : 


a) qu'exactement trois d'entre eux détectent l'avion ennemi ? 


b) qu'au moins un d'entre eux détecte l'avion ennemi ? 


206 Introduction à la statistique appliquée 


LOI HYPER- 
GÉOMÉTRIQUE 


LOI 
GÉOMÉTRIQUE 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


Pour une certaine marque de lampes de télévision, en moyenne 10 % 
brüûlent durant la période de garantie. Un marchand a vendu 10 de ces 
lampes et X représente le nombre de lampes qu'il devra remplacer durant 
la période de garantie. 


a) Calculez E{X). 


b) Quelle est la probabilité qu'il doive remplacer plus de 2 lampes ? 


On tire 5 cartes d'un jeu ordinaire de 52 cartes. Soit X le nombre de 
cartes de coeur parmi ces 5 cartes. 


a) Déterminez EX) et Var(X). 
b) Calculez P(X= 1). 
c) Calculez P(X > 2). 


Vous avez besoin de 2 piles pour votre lampe de poche. Vous avez en 
réserve 10 piles parmi lesquelles 6 sont bonnes et 4 sont « usées ». Vous 
tirez 2 piles au hasard. Quelle est la probabilité qu'elles soient toutes les 
deux bonnes ? 


On partage un jeu de cartes en deux piles égales (26 cartes par pile). Soit 
X le nombre de cartes rouges (coeur ou carreau) dans la première pile. 


a) Déterminez E{X) et Var(X). 
b) Est-il surprenant de trouver X > 17 ? 


Une classe est composée de 3 filles et 5 garçons. Un jour, à cause d'une 
tempête de neige, seulement 4 étudiants sont venus. Soit X le nombre de 
filles présentes au cours. Déterminez la fonction de masse p(x)]. 


Un couple décide d'avoir des enfants jusqu'à ce qu'il ait un garçon. 
Quelle est la probabilité qu'il ait 4 enfants ? Quelle est la probabilité qu'il 
ait 4 enfants ou plus ? Quelle est l'espérance mathématique du nombre 
d'enfants qu'il aura ? 


On lance un dé jusqu'à ce qu'apparaisse la face « 6 ». Quelle est la 
probabilité que le dé soit lancé exactement 8 fois ? 8 fois ou plus ? 


Vous avez besoin de monnaie pour un billet d'un dollar. Si l'on suppose 
qu'une personne sur trois peut (et accepte de) vous changer votre billet, 
quelle est la probabilité que vous deviez solliciter plus de 4 personnes 
avant d'obtenir satisfaction ? 


LOI DE 
POISSON 


DIVERS 


22. 


23. 


24. 


25. 


26. 


27. 


28. 
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Un joueur à la roulette mise toujours sur le noir, avec l'intention de 
s'arrêter au premier gain. Quelle est la probabilité qu'il doive jouer plus 
de 6 fois ? (On suppose que la probabilité d'avoir noir à la roulette est 
18/38 = 9/19. 

En moyenne, 300 voitures arrivent à un poste de péage en une heure. En 
supposant que la loi de Poisson s'applique, calculez la probabilité qu'il y 
ait au moins 4 arrivées en une minute. 


Calculez P(X = 2) si: 

a) Xest B(6, 1/2) 

b) Xest B(30, 1/10) 

c) Xest B(300, 1/100) 

d) Xest B(3 000, 1/1 000) 
e)] Xest Poisson(3). 


Une standardiste reçoit en moyenne 144 appels entre 14 heures et 
16 heures. En supposant que la loi de Poisson s'applique, calculez la 
probabilité que la standardiste reçoive 10 appels entre 14:00 et 14:10. 


On suppose que, dans une certaine ville, il se produit en moyenne 
1,5 décès par jour. Calculez la probabilité que, la semaine prochaine 
(7 jours) il y ait : 


a) exactement 8 décès ; 

b) exactement 10 décès ; 

c) exactement 2 jours sans décès ; 
d) au moins un décès chaque jour. 


Le taux de naïssance au Canada est d'environ 43 par heure. Quelle est la 
probabilité que durant les 5 prochaines minutes il y ait 3 naissances ou 
plus ? Quelle est la probabilité que 10 minutes s'écoulent sans aucune 
naissance ? 


Un psychiatre croit que 75 % de toutes les personnes qui visitent un 
médecin ont des problèmes de nature psychosomatique. Afin de vérifier 
sa théorie, il choisit 25 patients au hasard et il considère X le nombre de 
patients ayant des problèmes psychosomatiques. 
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29. 


30. 


31. 


32. 


a) Si sa théorie est vraie, que vaut E{X), Var(X) ? 


b) Si seulement 10 des 25 patients interviewés ont des problèmes 
psychosomatiques, quelles conclusions tirez-vous au sujet de sa 
théorie ? Expliquez. 


Au coin de la rue, il passe en moyenne un taxi toutes les 3 minutes mais 
40 % seulement de ces taxis sont inoccupés. J'ai besoin d'un taxi. 


a) Quelle est la probabilité que les trois premiers taxis qui passent 
soient occupés ? 


b) Quelle est la probabilité qu'aucun taxi libre n'arrive durant les 
20 premières minutes ? 


c) Quelle est l'espérance du nombre de taxis occupés qui précéderont 
l'arrivée du premier taxi libre ? 


Un lot de 120 oranges comporte 10 % de gâtées. On forme, au hasard, 
10 sacs de 12 oranges chacun. 


a) Quelles sont l'espérance et la variance du nombre d'oranges gâtées 
dans un sac donné ? 


b) Quelle est la probabilité qu'un sac donné ne compte que des oranges 
saines ? 


c) Parmi les 10 sacs, combien devraient, en moyenne, ne compter que 
des oranges saines ? 


En supposant l'équiprobabilité des sexes, déterminez le nombre d'enfants 
qu'un couple devrait avoir pour que la probabilité qu'au moins deux 
d'entre eux soient des garçons, soit supérieure ou égale à 0,9. 


Un couple décide d'avoir des enfants jusqu'à ce qu'il ait au moins un 
enfant de chaque sexe. 


a) Quelle est la probabilité qu'il ait 4 enfants ? 
b) Quelle est la probabilité qu'il ait 4 enfants ou plus ? 


c) Quelles sont l'espérance et la variance du nombre d'enfants qu'il 
aura ? 


Remarque Après que la première naissance soit observée, ce problème se 
ramène essentiellement au problème 19 où, possiblement, le mot « garçon » 
doit être remplacé par le mot « fille ». 


33. 


34. 


35. 


36. 


37. 
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Deux équipes de hockey s'affrontent dans une série « 4 dans 7 ». L'équipe 
A, plus forte, a 2 chances sur 3 de vaincre l'équipe B à chacune des 
parties. Quelle est la probabilité que l'équipe A gagne la série ? 


Deux équipes de hockey, de même force, s'affrontent dans une série 
« 4 dans 7 ». Soit X le nombre de parties nécessaires à la détermination 
de l'équipe championne. Déterminez la fonction de masse p{x, calculez 


E(X) et Var(X). 


On suppose que, dans un certain pays, 50 % des gens sont contre la 
peine de mort, 30 % sont pour et 20 % sont sans opinion. 


a) Lors d'un petit sondage auprès de 10 personnes, calculez la 
probabilité d'obtenir au moins 5 réponses favorables à la peine de 
mort. 


b) Lors d'un sondage, plus ambitieux, auprès de 1 000 personnes, 
déterminez l'espérance mathématique, la variance et l'écart-type du 
nombre X de réponses favorables à la peine de mort. 


c) Convient-il de retoucher les hypothèses initiales si, en b, on obtient 
X = 250 ? Si l'on obtient X = 315 ? 


d) Convient-il de retoucher les hypothèses initiales si, avec n = 10, on 
obtient X = 4 ? Si, avec n = 1 000 on obtient X = 400 ? 


Soit a et b deux entiers, a < b et X de loi Géom{(p). 
Montrez que P(X > b|X> a) = PX> b- a). 


Une partie éliminatoire de hockey oppose les équipes A et B. Durant la 
saison régulière (80 parties), l'équipe À a marqué 320 buts et en a 
accordé 288 ; l'équipe B a marqué 304 buts et en a subi 256. 


a) En supposant que les résultats de la saison régulière soient 
représentatifs des forces réelles de chaque équipe, à l'offensive 
comme à la défensive, combien de points chaque équipe devrait-elle 
marquer durant la partie ? 


b) Quelle est la probabilité qu'aucun but ne soit marqué durant la 
première période ? 
c) Quelle est la probabilité que l'équipe À marque exactement 2 buts en 


première période ? 


d) Quelle est la probabilité que 6 buts ou plus soient marqués durant la 
partie ? 
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38. 


39. 


*40. 


41. 


e) Quelle est la probabilité que l'équipe B marque au moins un but à 
chacune des trois périodes ? 


Afin d'estimer le nombre k de truites qui se trouvent dans un certain lac 
on réalise l'expérience qui suit : on prélève 100 truites du lac puis, après 
les avoir marquées, on les remet à l'eau. Plus tard on repêche 200 truites 
du lac et on observe le nombre X de truites marquées dans ce second 
prélèvement. 


a) SiX= 5, quelle valeur de k vous paraît la plus vraisemblable ? 


b) Le résultat X = 5 vous paraît-il étonnant si, en réalité, k = 5 000 ? 
20 000 ? 1 000 ? Commentez. 


On lance un dé jusqu'à ce que la face « 6 » soit obtenue pour la 10e fois. 
Déterminez l'espérance mathématique et la variance du nombre de 
lancers requis. 


Suggestion : Posez X = X1 + X2 + .… + X10 où X, est le nombre de lancers 
nécessaires à l'obtention du premier « 6 », X2 est le nombre de lancers 
supplémentaires nécessaires à l'obtention du deuxième « 6 », etc. 
Justifiez intuitivement l'indépendance des variables X1, X2, …., X10. 


On lance un dé ordinaire jusqu'à ce que chacune des six faces soit 
apparue au moins une fois. Soit X le nombre de lancers requis. 


a) Posons X = X1 + Xo + …. + X6 où Xk est le nombre de lancers 
supplémentaires nécessaires à l'obtention de la k-ième nouvelle face. 
Expliquez intuitivement les raisons qui font que ces Xkx sont 
indépendants et que chaque Xk est de loi Géom{7 — k)/6). 


b) Déterminez E(X) et Var(X). 


Déterminez l'espérance mathématique, la variance et l'écart-type de 
chacune des variables aléatoires suivantes : 


a) Le nombre de « faces » obtenues en lançant 200 pièces de monnaie. 


b) Le nombre de personnes nées un lundi dans un groupe de 20 
personnes. 


c) Le nombre de naissances durant une certaine heure dans un hôpital 
où, en moyenne, il se produit 12 naissances par jour. 


d) Le nombre total de points obtenus en lançant 100 dés. 


42. 


43. 


+44, 


45. 
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e) Le nombre de cartes de coeur parmi 13 cartes tirées d'un jeu de 
cartes ordinaire. 


f) Le nombre de fois qu'il faut lancer deux dés afin d'obtenir un « 12 ». 
g) Le nombre de fois qu'il faut lancer trois dés afin d'obtenir un « 18 ». 


On lance un dé 4 500 fois et on observe le nombre X de fois qu'apparaît 
le résultat « 6 ». 


a) Calculez E(X), Var(X) et ox. 


b) Convient-il de supposer que le dé est mal équilibré si l'on obtient 
X = 722 ? Si l'on obtient X = 822 ? 


On a fait 24 muffins avec une pâte à laquelle on a ajouté 250 raisins 
secs. Quelle est la probabilité qu'un muffin tiré de cette production ne 
contienne pas plus de 4 raisins secs ? 


Soit X le nombre de femmes parmi quatre personnes assises à une table 
de restaurant. Pour savoir si X est de loi binomiale, on observe la valeur 
de X pour 70 tables. Voici la distribution observée de X : 


Valeur de X 0 1 2 3 4 TOTAL 


Nombre de tables 15 15 11 14 15 70 


Utilisez un test du khi-deux pour tester l'hypothèse que la variable 
aléatoire X est de loi binomiale de paramètre p = 0,45 (Cette valeur de p 
est la proportion habituelle (connue) de femmes parmi les clients de ce 
restaurant. Il faudra procéder à un groupement des classes pour avoir 
des effectifs théoriques d'au moins 5). Si vous trouvez que X n'est pas de 
loi binomiale, pouvez-vous l'expliquer ? 


Dans une ville, le nombre d'accidents est en moyenne de 4 par jour. 
Donc, si X représente le nombre d'accidents en un jour donné, 
l'espérance de X est 4. Pour voir si X est de loi de Poisson, on observe le 
nombre d'accidents par jour pendant 92 jours. Voici la distribution 
observée de X: 


Valeur de X 0 1 2 3 4 5 6 7 TOTAL 


Nombre de jours 2 7 12 18 20 13 10 10 92 
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46. 


47. 


48. 


*49, 


Utilisez un test du Kkhi-deux pour tester l'hypothèse que la variable 
aléatoire X est de loi de Poisson de paramètre À = 4. (Les effectifs 
théoriques sont déterminés par la fonction de masse d'une variable de loi 
de Poisson ; il faudra procéder à un groupement des classes pour avoir 
des effectifs théoriques d'au moins 5). 


Un célèbre magicien qui prétendait avoir des pouvoirs de perception 
extrasensorielle a accepté de se livrer à une expérience dans laquelle il se 
proposait de deviner le résultat du lancer d'un dé. En 12 essais, il a 
réussi à deviner le résultat 10 fois. Vérifiez que la probabilité d'un 
nombre de succès supérieur ou égal à 10 est excessivement petite pour 
quelqu'un qui répond au hasard ; et expliquez à quelle conclusion ce fait 
a tendance à mener. 


Un certain test psychologique consiste à lire un paragraphe, et puis à 
répondre à 20 questions portant sur le texte lu. Un choix de 5 réponses 
est donné pour chaque question. Un évaluateur, tentant de démontrer 
que le test ne mesure pas l'aptitude à la lecture, répond aux 20 
questions sans avoir lu le texte. Il choisit la bonne réponse à 8 des 
questions. Calculez la probabilité d'avoir 8 succès ou plus, et discutez les 
implications sur la qualité du test. 


Il existe des conjectures selon lesquelles certaines personnes sont 
capables, dans une certaine mesure, de surseoir à leur mort afin de 
pouvoir une dernière fois vivre un des bons moments de la vie. 
Définissant un anniversaire de naissance comme un de ces bons 
moments, des chercheurs ont prélevé les dates de naissance et de mort 
dans un échantillon de 500 décès. Ils ont constaté que sur ces 500 
décès, 5 sont survenus le jour même de l'anniversaire du décédé. Ce 
nombre est supérieur à la normale, mais l'est-il assez pour confirmer les 
conjectures ? 


Un laboratoire qui effectue sur une grande échelle des tests pour détecter 
un certain anticorps peut épargner de l'effort en faisant un seul test sur 
plusieurs spécimens à la fois. Lorsque l'anticorps n'est pas présent dans 
l'ensemble des spécimens, c'est parce qu'il n'est présent dans aucun. On 
déclare alors un résultat négatif pour tous les patients sans plus de 
tests. Si le résultat est positif, cependant, on analyse chaque spécimen 
séparément. 


00. 


o1. 


52. 


6 Quelques lois discrètes 213 


a) Si l'on utilise cette approche avec 10 spécimens d'une population 
dont une certaine proportion p ont l'anticorps en question (sont 
« positifs »), quelle est l'espérance du nombre de tests qu'il faudra 
effectuer 


i) sip=0,10 ii) si p = 0,25. 


b) Pour quelles valeurs de p l'approche décrite ici est-elle préférable à 
l'approche usuelle (tester les 10 spécimens séparément) ? 


c) Si n est le nombre de spécimens qu'on groupe, montrer que 
l'approche décrite ici est préférable à l'approche usuelle si et 
seulement si 


p<i-(1/n)rr. 


Calculez la valeur limite de p pour n = 5, 10, 30, 50, 100, et expliquez 
intuitivement la décroissance de vos réponses. 


On suppose que dans une certaine région, la proportion des gens qui 
sont en faveur du libre-échange est p = 40 %. Lors d'un sondage auprès 
de 15 personnes, on trouve X = 11 personnes en faveur du libre-échange. 


a) Déterminez l'écart absolu | X - E(X)| entre la valeur observée de X et 
son espérance. 


b) Calculez la probabilité d'un écart absolu supérieur ou égal à l'écart 
calculé en a). 


c) Étant donné la probabilité calculée en b), y a-t-il lieu de retoucher 
l'hypothèse que p = 0,4 ? 


Une compagnie se fait accuser de discrimination pour avoir engagé 6 
hommes et une femme pour 7 postes identiques alors que des 
17 candidats qui s'étaient présentés, 9 étaient des femmes. Calculez la 
probabilité d'avoir si peu de femmes (c'est-à-dire, une ou moins) en 
supposant un choix au hasard. Qu'est-ce que ce calcul de probabilité 
peut apporter au débat ? 


Dans un village où ont été entreposés des déchets chimiques, on 
constate que 8 personnes ont été atteintes d'une certaine sorte de cancer 
dans une période de 5 ans. Étant donné que la population du village 
n'est que de 8 000, ce nombre semble excessif. Une commission, chargée 
de déterminer si les déchets chimiques ont contribué à hausser le taux, 
prélève des données sur les populations de plusieurs villages de taille et 
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93. 


04. 


99. 


*56. 


situation comparables. La commission découvre que durant la même 
période, il y a eu 588 cas dans un bassin de population de 2 350 000 
habitants. Considérez ce taux comme un taux normal (et connu sans 
erreur) pour calculer la probabilité d'avoir 8 cas ou plus dans une 
population de 8 000. Expliquez ce que ce calcul peut contribuer à la 
question posée par la commission. 


Si X est de loi B(10; 0,4), et si la cote Z'est définie comme d'habitude par 
Z=(X-u)/6, où u = E(X) et 62 = Var(X), calculez a) P(|Z]| > 2), et b) P(|Z| 
> 8). Comparez avec les bornes fournies par le théorème de Tchebychev. 


Supposons que le nombre d'erreurs typographiques dans un livre est une 
variable de loi de Poisson de paramètre À. On tire une page au hasard, et 
on n'y trouve aucune erreur. 


a) Calculez P(X = 0) en supposant que À = 5. La valeur À = 5 est-elle 
plausible ? 


b) Calculez P(X = O0) en supposant que À = 1. La valeur À = 1 est-elle 
plausible ? 


c) Convenons d'appeler « plausible » toute valeur de À pour laquelle 
P(X = 0) > 0,05. Quel est l'ensemble des valeurs plausibles de À ? 


Un défaut dans la fabrication de certaines plaques d'émail se produit 
normalement à un taux moyen de À = 1,2 par plaque. Afin de s'assurer 
que le taux de défectuosité reste bas, on adopte une procédure de 
contrôle qui consiste à prélever une plaque dans chaque lot de 
production et de rejeter le lot si la plaque contient 3 défauts ou plus. 


a) Quelle est la probabilité de rejeter un lot acceptable (c'est-à-dire, un 
lot pour lequel À = 1,2) ? 


b) Quelle est la probabilité d'accepter un lot pour lequel À = 3 ? 


c) Comment doit-on modifier la procédure si on veut que la probabilité 
de rejeter un lot acceptable (À = 1,2) ne soit que de 5 % ? 


Une population de comptes à recevoir est considérée inacceptable si la 
proportion p de comptes erronés est supérieure à 5 %. Un comptable 
utilise la procédure de vérification suivante : il tire les comptes, l'un 
après l'autre, et les vérifie au fur et à mesure. Si au x-ième compte tiré il 
n'a encore trouvé aucun compte erroné, il déclare que la population est 
acceptable ; si le premier compte erroné arrive au x-ième tirage ou avant, 
il déclare que la population est inacceptable. 
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a) Si x = 10, quelle est la probabilité qu'il déclare acceptable une 
population dont la proportion de documents erronés est p = 6 % ? 


b) Quelle doit être la valeur de x s'il veut que la probabilité de déclarer 
acceptable une population pour laquelle p = 6 % ne soit pas 
supérieure à 1 % ? 


Quelques lois continues 


7.5 


Variables continues et fonction de densité 

Loi uniforme 

Loi exponentielle 

Loi normale (ou loi de Laplace-Gauss) 

* Lecture de la table de la loi N(0, 1) 

* Calcul général avec u et 6° quelconques 

+ __ Somme et transformation linéaire de variables normales 
Théorème limite central 

*__ Approximation de la loi binomiale par la loi normale 
*__ Distribution d'une moyenne 

RÉSUMÉ 

EXERCICES 
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7.1 


VARIABLES CONTINUES ET FONCTION DE DENSITÉ 


On sait déjà que le comportement aléatoire d'une variable discrète est 
complètement décrit par la donnée de l'ensemble de toutes les valeurs qu'elle 
peut prendre et de la fonction de masse p{x) qui donne la probabilité de 
chacune de ces valeurs. 


Il arrive toutefois fréquemment que la variable aléatoire considérée puisse, 
du moins en théorie, prendre des valeurs liées les unes aux autres de façon 
continue. Par exemple, le poids d'un œuf peut être 56 grammes ou 
56,01 grammes ou 55,999 99 grammes. La probabilité qu'un œuf pèse 
exactement 56 grammes (ou tout autre poids précis donné à l'avance) est 
zéro. Chaque valeur particulière est « impossible »; seuls les intervalles 
contiennent suffisamment de points pour avoir une probabilité positive. Si 
l'on note X le poids, en grammes, de l'œuf, on sait qu'il est impossible que X 
soit exactement égal à 56 mais il se peut très bien qu'on obtienne 
95 < X < 60. 


Un autre exemple de variable aléatoire continue est le temps d'attente (en 
minutes) avant que soit livrée la pizza qu'on vient de commander par 
téléphone. Il est impossible que ce temps d'attente soit exactement 
25,000 0 minutes mais il est tout à fait possible que l'attente dure entre 24 
et 26 minutes. 


Le comportement d'une variable aléatoire X continue sera décrit au moyen 
d'une fonction fx), appelée fonction de densité, telle que la probabilité que 
X prenne une valeur entre deux bornes données a et b soit déterminée par la 
surface, entre a et b, sous le graphique de f{x. 


Là où la fonction fx) est élevée, les valeurs de x sont plus probables, plus 
fréquentes, que là où fx) est basse. 


La fonction de densité doit posséder les deux propriétés suivantes : 


a) fl» > 0 pour tout x. 


b) La surface totale sous le graphique de f(x) doit être égale à 1. 


La première de ces deux propriétés rend impossible l'obtention d'intervalles 
de probabilité négative. La seconde nous assure que 


P(-o <X <æ)=1. 
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FIGURE 7.1 
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L'espérance mathématique et la variance d'une variable aléatoire continue 
s'obtiennent de sa fonction de densité par un traitement analogue à celui qui 
permettait de les obtenir, dans le cas discret, au moyen de la fonction de 
masse p(x. Techniquement, il suffit de remplacer les sommes (discrètes) par 
des intégrales (continues). Le lecteur qui ne connaît pas le calcul intégral n'a 
pas à s'inquiéter : tout peut être fait en raisonnant directement sur les 
graphiques. Qu'il soit suffisant de faire remarquer que l'espérance 
mathématique u correspond au « centre de gravité » du graphique de la 
fonction de densité, c'est à-dire, au point où l'on devrait placer un pivot sous 
le graphique de fx, découpé dans du « carton » d'épaisseur uniforme, pour 
qu'il reste en équilibre horizontal. 


Fonction de densité 


fx) 
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FIGURE 7.2 Visualisation de 1 en termes de centre de gravité 


fx) 


Cette « visualisation » de l'espérance mathématique en termes de centre de 
gravité, aussi applicable au diagramme à bâtons (dans le cas discret), permet 
souvent d'éviter d'avoir recours aux techniques du calcul intégral. 


Exemple 1 Considérons une variable aléatoire continue dont la fonction de densité est 


% sil<x<3 


ro] 


0 sinon 


Le graphique de cette fonction de densité apparaît à la figure 7.8. 


On vérifie aisément que fx > O pour tout x et que la surface totale sous le 
graphique se réduit à celle d'un rectangle de hauteur 1/2 et de longueur 2. 
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FIGURE 7.3 Densité uniforme entre 1 et 3 


fx) 


@----------- 
x 


Cette surface totale est donc 1. Enfin, par un simple argument de symétrie, 
on voit que 1 = 2, le point central du rectangle. Si l'on observait un très 
grand nombre de valeurs de X, on sent bien que les petites valeurs de X 
(disons, entre 1 et 2) seraient exactement compensées par des valeurs aussi 
nombreuses dans la seconde moitié de l'intervalle. Plus le nombre 
d'observations sera grand, plus la moyenne des résultats obtenus aura 
tendance à s'approcher du point central u = 2. + 


Exemple 2 Considérons une variable aléatoire X dont la fonction de densité est : 


2x si0<x<I 


ro] 


0 sinon 


Déterminer P(0,2 < X < 0,8). 
La fonction de densité fx) apparaît à la figure 7.4. 


FIGURE 7.4 
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Calcul de P(0,2 < X< 0,8) 


fx) 
Dpe Mes Sema ne ou j; 
CR 
SE A 
i i i nË 
| | | 
0 0,2 0,8 1 


On vérifie aisément que la surface totale sous le graphique de fx) est bien 
égale à 1 puisque c'est la surface d'un triangle de base 1 et de hauteur 2. 


La probabilité cherchée, P(0,2 < X < 0,8) est donnée par la surface de la 
région ombrée dans la figure 7.4. Cette surface S s'obtient aisément par 
simple toisé. Quand x varie de 0,2 à 0,8, la densité f(x = 2x varie (en ligne 
droite) de 0,4 à 1,6. La surface cherchée est donc celle d'un trapèze de base 
0,6 et de hauteur moyenne (0,4 + 1,6)/2 = 1. 


On trouve donc P(0,2 < X < 0,8) = S = 0,6. 


: : 0,2x0,4 
On obtient aussi P(0 < X <0,2) = =-0,04 
2 
1,6 + 2,0 
et P(0,8<X<1)-0,2%x 0,36 + 
2 


Remarquons que la probabilité qu'une variable aléatoire continue 
appartienne à un certain intervalle n'est aucunement influencée par la 
nature des inégalités qui limitent l'intervalle. Les points extrêmes de 
l'intervalle peuvent être exclus (inégalités strictes) ou inclus (inégalités non 
strictes), chaque point isolé étant de probabilité nulle. Ainsi, dans 
l'exemple 2,ona 


P(0,2 < X <0,8)= P(0,2<X <0,8)=P0,2< X <0.8) 
= P(0,2< X <0,8) = 0.6. 
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7.2 


FIGURE 7.5 


LOI UNIFORME 


Une variable aléatoire X est dite de loi uniforme sur l'intervalle (a, b) si sa 


fonction de densité est : 


TE 


f00 = 
(x) u 


a) sia<x<b 


sinon 


La fonction de densité fest illustrée à la figure 7.5. 


Fonction de densité d'une variable de la loi uniforme sur (a, b) 


(69 


La valeur 1/(b - a) a évidemment été obtenue du fait que le rectangle doit 
être de surface 1. Il s'agit bien sûr d'une généralisation immédiate de 


l'exemple 1. 


On utilise la notation « X est U{a, b) » pour indiquer que la variable aléatoire 
X est de loi uniforme sur l'intervalle (a, b). Il va de soi que si X est U{a, b) 
alors 1 = (a + b)/2, le point central de l'intervalle « accessible ». La formule 
donnant la variance o?, qui peut s'obtenir par les techniques du calcul 
intégral, n'est ici donnée que par souci de complétude. 


Si X est U(a, b), alors sa moyenne et sa variance s'expriment en fonction de a 


et b: 


a+b 


2 
G 


_(b-aŸ 


u = 
2 


12 


Exemple 3 
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Notons enfin que la loi uniforme n'est pas d'application très fréquente ; on la 
rencontre dans des situations comme celle de l'exemple suivant. 


Quand on regarde une horloge, l'aiguille des secondes peut indiquer 
n'importe quelle direction. Si l'on suppose que le nombre X indiqué par 
l'aiguille est (en théorie) observé avec une précision infinie, on a que X est de 
loi U(O, 60). 


On a alors que 
u =E(X)=30, o? =Var(X)=300, & = 300 +17,320 51. 
On peut aussi calculer que P(0 < X < 30) = 1/2, 


, 


1 
P(13<X<9,1) (9,1-1,3) = 
60 60 


=0,13, etc. 


1.3 


LOI EXPONENTIELLE 


Une variable aléatoire X est dite de loi exponentielle avec moyenne 6 > O 
(lettre grecque théta) si sa fonction de densité est : 


1 x 

—e # si x >0 
F(X) =<0 

0 sinon 


En notation abrégée, on écrira : « X est Exp(0) ». 
Graphiquement, cette fonction de densité a l'allure illustrée par la figure 7.6. 


La loi exponentielle se rencontre dans une foule de situations. En particulier, 
presque tous les phénomènes aléatoires du type « temps d'attente avant que 
ne se produise un certain événement » admettent la loi exponentielle comme 
modèle probabiliste. 


La loi exponentielle est intimement liée à la loi de Poisson. En fait, si des 
événements se produisent selon un « processus » de Poisson, c'est-à-dire si le 
nombre d'événements qui se produit, durant un intervalle de temps de 
longueur t, suit une loi Poisson(i) avec À = ct, alors le temps d'attente entre 
deux événements consécutifs suivra une loi exponentielle avec O0 = 1/c. 
Intuitivement, on voit que s'il se produit en moyenne c événements par 
heure, il y aura, en moyenne, 1/c heure entre les événements consécutifs. 


224 Introduction à la statistique appliquée 


FIGURE 7.6 


Exemple 4 


Exemple 5 


Fonction de densité d'une variable Exp(6) 


fx) 


1/8 


Si, à la salle d'urgence d'un hôpital, il se produit en moyenne 20 arrivées à 
l'heure, on peut supposer que le nombre d'arrivées durant une période de t 
heures suivra une loi Poisson(20t. Le temps d'attente entre deux arrivées 
consécutives suivra alors une loi Exp(1/20). + 


La moyenne et la variance d'une variable de loi exponentielle s'expriment 
très simplement en fonction du paramètre 6, tout comme l'aire sous la 
courbe à droite d'une valeur donnée. 


Si X est de loi Exp(0), alors 


TR 
et P(X >x)=e ’? pour x>0. 


Dans une certaine machine, le fusible de sécurité saute, en moyenne, toutes 
les 40 heures d'utilisation. Quelle est la probabilité que la machine 
fonctionne plus de 70 heures sans que le fusible n'ait à être remplacé ? 


En supposant que le temps de fonctionnement X (en heures) de la machine 
est de loi Exp(40), on obtient 


P(X>70)=e /# =e 175 20173 77. 
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FIGURE 7.7 


LOI NORMALE (OU LOI DE LAPLACE-GAUSS) 


Une variable aléatoire X est dite de loi normale si sa fonction de densité est 


F0) = a-U-H)? 124 ° 


6 27 


où les paramètres LH et o2 désignent respectivement l'espérance et la 
variance de Xetoù e et x sont les constantes mathématiques bien connues, 
dont les valeurs approximatives sont 


es 2,718 28183, r+3,141 592 65. 


En notation abrégée, on écrit « X est N{u, o?) ». La densité f(x) d'une variable 
aléatoire de loi Mu,62) a l'allure illustrée par la figure 7.7. 


Fonction de densité d'une variable N(1, o2) 


fx) 


points d'inflexion 


u—o mn u+o 


La fonction de densité d'une variable de loi Mu, o?) est symétrique de part et 
d'autre de la moyenne un. L'écart-type © est plus malaisé à visualiser : il 
correspond à la distance entre l'axe de symétrie (x = u) et l'un ou l'autre des 
deux points d'inflexion, c'est-à-dire des deux points où la courbure change de 
sens. 


Innombrables sont les exemples de variables normales ou pratiquement 
normales. Des mesures analogues prises sur des objets semblables ont en 
effet souvent tendance à se distribuer selon une courbe « en cloche » : les 
valeurs moyennes sont les plus fréquentes et, de part et d'autre de ces 
valeurs moyennes, les valeurs extrêmes sont, symétriquement, de plus en 
plus rares. 
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FIGURE 7.8 Quelques exemples de lois normales 


fx) 


N(O, 1/4) 


N(-3, 1/4) N(5/2, 1/4) 


La loi normale permet alors d'obtenir, sinon une description exacte de la 
distribution, du moins une excellente approximation de celle-ci. 


FIGURE 7.9 
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Si, par exemple, on achète une boîte de clous de même format et qu'on 
mesure avec précision la longueur de chaque clou, on obtiendra plusieurs 
mesures, vraisemblablement toutes voisines les unes des autres. 
L'histogramme des résultats obtenus sera semblable à celui présenté à la 
figure 7.9. 


Histogramme des longueurs de 160 clous 


Effectifs 


47 48 49 50 51 52 53 54 


Longueur des clous, en millimètres 


Comme l'indique l'histogramme de la figure 7.9, les valeurs anormalement 
grandes ou anormalement petites deviennent de plus en plus rares, 
symétriquement, de part et d'autre de la « bosse » correspondant aux valeurs 
moyennes. C'est un exemple comme tant d'autres d'un phénomène dont la 
représentation graphique a indéniablement l'allure d'une normale. 


Lecture de la table de la loi N(0, 1). À la fin de cet ouvrage, on trouve une 
table 3 applicable au cas où u = 0 et 62 = 1. Si Zest une variable aléatoire de 
loi N{0, 1), la table permet de trouver directement les probabilités de la forme 
P(Z > 2) où z> CO. 


Par exemple, P(Z > 0,84) = 0,200 5. Ce résultat se trouve à l'intersection de la 
rangée correspondant à z = 0,8 et de la colonne qui permet de raffiner la 
seconde décimale à 0,04. 


Tirant profit du fait que la densité de Z est symétrique par rapport à zéro et 
que la surface totale sous la courbe donne 1, la table de la loi MO, 1) est 
suffisante pour solutionner tout problème de la forme P(a < M{0, 1) < b). 
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FIGURE 7.10 P(-0,67 < N(0, 1) < 1,22) = 0,637 4 


—0,67 0 1,22 


FIGURE 7.11 P(N(0, 1) > 0,84) = 0,200 5 


surface = 0,200 5 


Exemple 6 Calculer P(-0,67 < Z< 1,22) si Zest N{0, 1). 
Solution 
P(-0,67 <Z <1,22)= 1-P(Z>1,22)-P(Z >0,67) 
=1-0,1112-0,2514 
= 0,637 4. 


+ 


La densité d'une variable N{(O, 1) tend très rapidement vers zéro à gauche 
comme à droite. Afin d'illustrer la vitesse de cette convergence, qu'il soit 
suffisant d'indiquer que : 


Exemple 7 
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P(N(0,1) > 4,75) = — 
1000 000 


P(N(0,1) > 6,00) = 
1000 000 000 


Calcul général avec LH et o 2? quelconques. Évidemment, rares sont les cas où 
on a la chance d'avoir u = O et 62 = 1. Habituellement, les valeurs de Lu et o2 


sont quelconques et on doit transformer la variable x, de loi N{u,o?) pour que 
la table soit utilisable. La transformation requise, heureusement, est simple. 


Si X est de loi Mu,o?), alors 


X— 
VA EE 


est de loi N(0,1). 
6 


Z est simplement la cote Z de X. Cette propriété fondamentale de la loi 
normale peut être énoncée sous une autre forme, plus directement 
applicable : 


peu nas?) <= PÊTE en < 2 #) 
(e] [eo] 


Si l'on suppose que le poids, en grammes, d'un bébé à la naissance suit une 
loi M3 300,250 000), déterminer la probabilité que le poids d'un certain bébé 
soit compris entre 3,0 kg et 4,0 kg. 


Solution : Dans cet exemple, on cherche P(3 000 < X < 4 000) où X est de loi 
Mu,0?) avec u = 3 300 et o = 500. 
On trouve 
P(3 000 < X < 4 000) = P(3 000 < N(3 300,250 000) < 4 000) 
3 000 —-3 300 4 000 —-3 300 
=P NON LE 
500 
= P(-0,60 < N(0,1) <1,40) 
= 1-P(N(0,1) >0,60)-P(N0,1) > 1,40) 
= 1-0,274 3-0,080 8 
= 0,644 9. 


Selon nos calculs, environ 64,5 % des bébés pèsent donc entre 3 kg et 4 kg. + 
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Exemple 8 


Somme et transformation linéaire de variables normales Nous venons de voir 
que si X est normale, Z l'est aussi. C'est là une des nombreuses applications 
d'une importante propriété de la loi normale, souvent résumée par la phrase 
« toute combinaison linéaire de normales indépendantes est normale », et dont 
l'énoncé mathématique comporte les deux parties suivantes : 


a) Si X est de loi normale Mu,6?), alors a + bX est normale, de loi 
N(a + bu, bo2). 
b) Si X1, .…, Xn, sont des variables normales indépendantes, de lois 


respectives Mu,,5?), …, N{u,,o’), alors leur somme X1 + … + Xn est 


normale, de loi 
2 2 
N(U+..+h,,6, +..+6,). 


On voit qu'en particulier, une somme ou une différence de deux variables 
normales indépendantes est normale. 


X+YestN(u,+u,,0% +62) 
et X-YestN(u,-u,,0% +02). 


On suppose que le poids (en grammes) d'un œuf se distribue selon une loi 
N(56,20). Quelle est la probabilité que la somme des poids de 12 œufs 
dépasse 700 grammes ? 


Solution : Le poids total X = X; + ...+ X:, des 12 œufs est tel que E(X) = E(X1 + 
. + X19) = 12 x 56 = 672 et Var(X) = Var(X1 + … + X12) = 12 x 20 = 240. 
Aussi, À étant une somme de variables normales est de loi normale. X est de 
loi M672,240). 
On trouve donc 
P(X > 700) = P(N(672,240) > 700) 
700 -672 
V240 
= P(N(0,1) > 1,807) 
= 0,035 3. 


= eLnen > 


+ 


Remarque La dernière valeur a été obtenue de la table de la loi N(0, 1) en 
interpolant entre les valeurs trouvées pour z = 1,80 et pour z = 1,81. 
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1.5 


THÉORÈME LIMITE CENTRAL 


L'exemple 8 montre bien à quel point il est intéressant de pouvoir utiliser la 
normalité d'une somme de normales. Toutefois, la loi normale jouit d'une 
autre propriété, beaucoup plus puissante et spectaculaire, décrite dans ce 
qu'on appelle le théorème limite central. Ce théorème, déjà pressenti au 
XVIII siècle, et auquel furent associés les noms de mathématiciens aussi 
connus que De Moivre, Gauss et Laplace, a été démontré dans toute sa 
généralité vers 1920 par Lindeberg et Levy. En voici l'énoncé, « en mots ». 


Théorème limite central Soit un grand nombre n de variables indépendantes 
X1, X2, …, Xn. Alors, sous certaines conditions, leur somme X = X1 + … + Xn, 
suit approximativement une loi normale, même si ces variables ne sont pas 
normales. 


Les conditions évoquées dans l'énoncé du théorème se ramènent 
essentiellement à l'exigence qu'aucune des variables ne soit indûment 
prépondérante sur les autres. En d'autres termes, ce théorème affirme que si 
l'on additionne un grand nombre de petites composantes indépendantes, 
leur somme est une variable X approximativement normale. 


C'est ainsi, sans doute, qu'on peut expliquer pourquoi un grand nombre de 
phénomènes naturels ont une distribution à peu près normale. On peut 
présumer, par exemple, que la taille des individus d'une espèce donnée est 
résultante d'un grand nombre de facteurs, hérédité, climat, alimentation, 
etc., qu'on peut considérer indépendants. 


Nous admettons que ces conditions ne sont pas faciles à vérifier dans les 
situations où seule la somme X est observée et non les termes X1, X2, ..…., Xn. 
C'est pourquoi nous ne pouvons pas être sûrs a priori de la normalité d'une 
variable telle la taille ; nous pouvons soupçonner que la taille suit une loi 
normale, mais nous sentons en général le besoin de faire confirmer ces 
soupçons par des données empiriques. Cependant, dans la plupart des 
applications du théorème limite central, les variables X:, ..., X, dont X est la 
somme ne sont pas des variables vaguement définies et à peine perçues. Ce 
sont, au contraire, des variables observables et, de plus, elles sont de même 
loi. Dans des cas comme ceux-ci, il est préférable d'invoquer une autre 
version du théorème limite central dont les hypothèses sont plus faciles à 
vérifier. L'énoncé suit. 
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Exemple 9 


Exemple 10 


Théorème limite central (variables de même loi) Considérons un grand 
nombre n de variables indépendantes X1, X2, ..…., X1 de même loi. Alors leur 
somme X = X1 +... + Xn, suit approximativement une loi normale, même si ces 
variables ne sont pas normales. 


Remarquez que nous ajoutons la condition que les variables X1, X2, .…, Xn 
soient de même loi, mais nous éliminons l'allusion à d'autres conditions. 


Remarque Une condition essentielle au théorème limite central est que n soit 
grand: l'approximation sera d'autant meilleure que n sera grand. 
Malheureusement, on ne peut pas donner une valeur de n à partir de laquelle 
l'approximation sera « bonne » ; d'abord parce que cela exigerait qu'on trouve 
une définition non arbitraire de « bonne » ; ensuite parce que la qualité d'une 
approximation — quelle que soit la façon dont on la mesure - dépend fortement 
de la distribution des variables dont X est la somme. Pour certains auteurs, 
une valeur de n supérieure à 30 est suffisante, alors que pour d'autres, il faut 
que n dépasse 100. Ces nombres ne sont que des conventions ; ils ne peuvent 
avoir de propriétés démontrables que dans des conditions trop précises pour 
être utiles. L'expérience montre, cependant, que si X1, .…, X\ suivent une loi qui 
n'est pas excessivement asymétrique, leur somme sera assez proche d'une 
normale même avec n relativement petit, par exemple n = 30. Le lecteur pourra 
plus loin se faire une idée de la rapidité de la convergence vers une normale 
en examinant les quelques cas exposés dans les figures 7.14 et 7.15. 


Considérons la somme X des points obtenus en lançant 100 dés. Les dés 
sont indépendants et les variables représentant les divers lancers sont de 
même loi. X sera alors approximativement normale, même si les variables 
dont X est la somme ont une distribution uniforme (discrète). + 


Supposons que le poids (en kg) des adultes se distribue avec une moyenne 
de 64 et un écart-type de 12. Dans un ascenseur, une plaque indique 
« Capacité maximale : 12 personnes ou 1 000 kg ». Si 14 personnes 
s'entassent dans l'ascenseur, quelle est la probabilité que leur poids total 
dépasse 1 000 kg ? 


Solution : Si X est le poids total des personnes dans l'ascenseur, alors X est 
approximativement normale, avec 


u = 14 x 64 = 896 et o62 = 14 x 144 = 2 016. 


Exemple 11 
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Alors 
P(X > 1000) = P(N(896,2 016) > 1000) 
= P(N(0,1) > 2,32) 
= 0,010 2. 
+ 

Approximation de la loi binomiale par la loi normale La répétition d'une 
expérience de type binomial fournit un bel exemple d'application du 
théorème limite central. Dans ce cas, en effet, plusieurs composantes 
indépendantes, toutes de même loi, sont ajoutées, de sorte que leur somme 


est alors proche d'une normale. Rappelons que chacune de ces composantes 
représente un « succès » ou un « échec ». 


On lance 16 sous. Calculer la probabilité que le nombre de faces obtenu soit 
compris entre 5 et 10, bornes comprises. On cherche P(5 < X < 10) où X est 
de loi B(16, 1/2). La réponse exacte peut être obtenue en utilisant la fonction 
de masse d'une loi binomiale, avec n = 16 et p = 1/2, et en calculant 


P(S<X<10)= p(5s)+p(6)+p(7)+p(8)+p(9)+p(10) 
, 56 134 


= = 0,856 54. 
65 536 


Le théorème limite central permet d'obtenir, en moins d'efforts, une 
excellente approximation pour la valeur cherchée. Il suffit d'approximer la 
distribution de X au moyen d'une loi normale ajustée à 1 = np = 8 et 
o2 = npq = 4. 


X est approximativement de loi N{(8,4) et il ne reste plus qu'à calculer 
P5 <X< 10). 


Il convient cependant de retoucher légèrement les bornes 5 et 10 pour 
compenser le fait que la variable X soit, en réalité, une variable discrète qui 
ne prend que des valeurs entières. 


La figure 7.12 illustre l'ajustement de la loi MN8,4) à l'histogramme de la loi 
B(16,1/2). On voit aisément que la réponse cherchée, p(5) + p(6) + .… + p(10) 
correspond à la surface, entre 4,5 et 10,5, sous le graphique en escalier du 
diagramme à bâtons. Cette surface est très voisine de celle, comprise entre 
les mêmes bornes, sous le graphique continu de la loi normale qui épouse le 
diagramme à bâtons. 
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FIGURE 7.12 


On trouve enfin : 
P(5< X <10)+ P(4,5 < N(8,4)<10,5) 


4,5-8 10,5 -8 
= P < N(0,1) < ————— 
2 2 


= P(-1,75 < N(0,1) < 1,25) 
= 1-(P(N(0,1) > 1,75)-P(N(0,1) > 1,25)) 
= 1-0,040 1-0,105 6 

= 0,854 3. 


On constate que cette réponse est très voisine de la valeur exacte 0,856 54 
obtenue précédemment en utilisant directement la loi binomiale. 


Si l'on avait négligé d'effectuer la « correction pour la continuité » (c'est-à-dire, 
si l'on avait conservé les bornes à 5 et à 10 plutôt que de les porter à 4,5 et 
10,5), on n'aurait compté qu'à moitié la surface des bâtons extrêmes placés à 
5 et à 10, ce qui aurait donné une réponse (0,774 5) trop petite et beaucoup 
moins précise. + 


L'exemple précédent, et en particulier la figure 7.12, illustre bien 
l'importance de la correction pour la continuité. Lorsqu'on fait 
l'approximation de la distribution d'une variable discrète par la loi normale, 
il convient, si nécessaire, de retoucher les bornes et de les placer à mi-chemin 
entre l'événement étudié et son complément. 


Ajustement d'une loi N(8,4) à une loi B(16,1/2) 


FIGURE 7.13 
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Notons toutefois que si la variable approximée est elle-même continue, 
aucune correction pour la continuité n'est requise. 


Remarque Le théorème limite central, appliqué à l'approximation de Bf(n,p) par 
N{np, npqa), nous apprend qu'elle est d'autant meilleure que n est plus grand. 
La précision de l'approximation dépend donc de n, mais aussi de p. C'est 
ainsi qu'on dit souvent que la précision sera bonne si npq > 5. Bien que cette 
règle soit elle-même approximative (l'exemple 12 la contredit d'ailleurs jusqu'à 
un certain point, puisque l'approximation y est très bonne, alors que npq y est 
égal à 4), la figure 7.13 montre bien comment, pour un n donné, la tendance 
est plus près d'une normale si p est plus près de 1/2. 


À regarder de près le diagramme à bâtons de B(16; 0,1) (figure 7.13) on peut 
sans doute se demander si une distribution de Poisson ne fournirait pas ici 
une meilleure approximation qu'une loi normale. 


Diagramme à bâtons de B(16; 0,6) et de B(16; 0,1) 

02 p(x) 

0,18 

0,16 

0,14 

0,12 B(16; 0,6) 
0,1 

0,08 


0 1 2,3 4 5 6 7 8 9 10 11 12 13 14 15 16 
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x 
0,35 p(x) 


0,3 


0,25 


B(16; 0,1) 
0,2 


Distribution d'une moyenne On a très souvent, en statistique, à estimer la 
moyenne p d'une population ; la moyenne échantillonnale X est alors 
utilisée. Comme nous le verrons en détail au chapitre 8, il est alors 


nécessaire de connaître la distribution de X. Or, le théorème limite central 
permet de l'obtenir ; c'est le résultat suivant : 


Si X est la moyenne de n observations indépendantes X1, …, Xn, où E(Xÿ = 
u et Var(X) =o2, alors, si n est grand, X est approximativement de loi 
N{u,62/n). 


Au-delà de la normalité, conséquence du théorème limite central, ce résultat 
se révèle conforme à notre intuition : plus nest grand, plus X aura tendance 
à être près de u et plus la variance de X sera petite ; dans les échantillons de 
n observations, les valeurs « petites » et les valeurs « grandes » auront tendance 
à s'équilibrer, faisant apparaître des moyennes X peu dispersées. 


Exemple 12 


Exemple 13 
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Si l'on suppose que le poids, en grammes, des œufs suit une loi M56,20), 
quelle est la probabilité que le poids moyen de 100 œufs choisis au hasard 
soit entre 55 et 57 grammes ? 


Ici, X est de loi M56, 20/100). 
On obtient donc que 
P(55 < X <57) = P(55 < N(56: 0,2) < 57) 
55 — 56 EN(O.1 < 57 -56 
vo.2 vo.2 
= P(-2,24 < N(0,1) < 2,24) 
= 0,975 O. 


DE 


+ 
Les figures 7.14 et 7.15 illustrent, pour différentes valeurs de n, la 
distribution de la moyenne X = (1/n)2X. On voit clairement que, plus n est 
grand, plus la distribution de X s'approche d'une distribution normale. 


Dans la figure 7.14, les variables Xi sont de loi Exp(l). 


e * six>0 
F(X) = 
O0 six<O0 


Dans la figure 7.15, les variables Xi suivent une loi « triangulaire double » 
avec la fonction de densité : 
1-x si0<x<1 
F(X)=4x-1 si1<x <2 


0 sinon 
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FIGURE 7.14 Distribution de la moyenne X pour différentes valeurs de n 


Ja) fa) 


S@) fa) 


Ja) fa) 


n=30 
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FIGURE 7.14 Distribution de la moyenne X pour différentes valeurs de n 


Ja) fa) 


Sa) fa) 


Ja) 
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RÉSUMÉ 


La probabilité qu'une variable aléatoire continue prenne valeur entre deux 
bornes a et b est donnée par la surface, entre a et b, sous le graphique de la 
fonction de densité f(x). 


Loi fx) M o? 
| a+b (b-a)? 
U(a,b) sia<x<b 
b-a 2 12 
1 —x/8 : 2 
Exp (8 ) si x > 0 [) 0 
1 2 2 
-(x-u)" /20 
No ?) “AU n o? 


a-— b- 
PtaéNtu.o2)2b)= Pl 2 Non 2" 
[e} G 
Théorème limite central : Si une variable aléatoire X est la somme d'un 


grand nombre de petites composantes indépendantes, alors X est 
approximativement de loi normale. 


Si une variable discrète est approximée par la loi normale, il convient 
d'effectuer une correction pour la continuité, c'est-à-dire, de retoucher les 
bornes afin de les placer à mi-chemin entre l'événement étudié et son 
complément. 


X est approximativement de loi Mu, 62/n) où u et o2 désignent l'espérance 


et la variance de chacun des Xi, X2, .…., Xn. 
EXERCICES 
VARIABLES Parmi les fonctions f(x suivantes, lesquelles peuvent servir de fonction de 
CONTINUES er densité ? 
FONCTION DE a) F(X) = 
DENSITÉ 
1. 1 si3<x<4 


b) f(x) -| 


O sinon 


2x 
c) f(x) = 
2 
d) f(x)= 
) f(x) à 
7% 
e) FX) ={ 
0 
3+2x 
1 - F(X)=< * 
0 
ag) f(x)= 
0 
h ro =] 
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si0<x<1 


sinon 


si6<x<8 


sinon 


si—-1<x<0 
si0<x<2 


sinon 


si0<x<1 


sinon 


x? 1 SiW<x<Y 


sinon 


Yo Si—-2< x <10 


O sinon 


Considérons une variable aléatoire continue dont la densité est 


O sinon 


ne 
CR si0 <x<2 


Calculez les probabilités suivantes : 


a 


® 8 © E ? 


Re) 


P(X = 1) 
P(0 < X< 1/2) 
P(0 < X<-— 1/2) 


P(1,4 < X< 3,2) 
P(-2 < X<-1) 
P(0,4 < X< 0,5) 
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8. Soit X une variable aléatoire dont la fonction de densité est 


x Si0<x<1 


FOD=IY si2<x<3 


0 sinon 

Calculez : 

a) P(X< 1,5) b) P{X < 0,9) 

c) P(X > 2,2) d) P-2<X< 2) 

€) P(1/2< X< 2/3) fn P6<X<9) 

g PIX-2]<0,5) b) PIX-1,5] < 0,9) 
LoiuniroRmE 4. Soit X une variable aléatoire de loi U{3,8). Calculez : 

a) P(X> 4) b) P(X<4) 

c) P(X< 4) d) P4<X<7) 

e) PH<X< 9) ÿ PX>h) 


g) Pu-6,<X<u+o) h) Pu-26<X<u+ 206) 


i) Comparez la probabilité calculée en h) avec la borne obtenue de 
l'inégalilé de Tchebychev. 


LOI 5. Soit X une variable aléatoire de loi Exp(2). Calculez : 
FRÉRNENMERCE a) P(X>2) b) P(X> 2) 

c) P(X>5) d) PX> 1/5) 

e) P(1/5<X<5) f PO<X< 10) 

g) P-1<X< 10) h) P(0,34 < X < 4,75) 


6. Une certaine machine fonctionne en moyenne 10 jours avant de tomber 
en panne. En supposant que ce temps de fonctionnement suive une loi 
exponentielle, déterminez la probabilité que : 


a) la machine tombe en panne dès le premier jour ; 
b) la première panne survienne durant le quatrième jour ; 


c) iln'y ait aucune panne durant les 30 premiers jours. 


LA LOI 


NORMALE 


10. 
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Arthur a besoin d'un taxi. Devant sa maison il passe, en moyenne, un 
taxi (libre) à toutes les 3 minutes (selon un processus de Poisson). 
Déterminez la probabilité que : 


a) Arthur attende plus de 10 minutes avant d'avoir un taxi; 
b) Arthur trouve un taxi durant les 10 premières minutes ; 
c) Arthur trouve un taxi durant les 30 premières secondes. 


Le service d'urgence d'un hôpital reçoit, en moyenne, 30 patients par 
heure. Déterminez la probabilité que : 


a) aucun patient n'arrive durant les 5 prochaines minutes ; 
b) exactement 4 patients arrivent durant les 2 prochaines minutes. 


Remarque La partie b) se fait en utilisant la loi de Poisson. 


Soit X une variable aléatoire de loi N0,1). Calculez : 


a) P(X> 1) b) PH<X<]1) 

c) P(-1,96<X< 1,96) d) P0O<X<2) 

e) P(X > 3,09) f) P(-1,28 < X < 1,28) 

g) P(0,7 < X < 0,8) h) P(-0,1< X < 7,2) 

i)  P(IX] > 2,58) j) P(IX-2]<0,1) 

Soit X une variable aléatoire de loi M20,25). Calculez : 
a) P(X> 15) b) P(15 < X < 25) 

c) P(16 < X < 26) d) P(X > 30) 

e) P(X< 30) f P(X< 20,4) 

g) P(31,2 < X < 31,3) h) P(-1< X < 42) 


i) P(IX- 20] < 9,8) jj P(IX-281 > 10) 
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11. 


12. 


15. 


14. 


15. 


Soit X une variable aléatoire de loi M0, 1). Déterminez c tel que : 


a PX>4d=0,1 b) PIX > à = 0,01 
c) P-c<X<d=0,90 d) P-c<X< ©) = 0,99 
e) P(X> ©) = 0,99 ÿ P(X<d=0,10 


g) P(IX] < c) = 0,99 h) Pfc<X< c) = 0,999 
 P-c<X<c=0,1 j P-c<X< c = 0,95 

Soit X une variable aléatoire de loi M10, 16). Déterminez c tel que : 
a) PX>d0d=1% b) PAX<d=90% 

c) PIX-10| >d=5% d) P[X-10] < d =90% 


On lance 100 sous et on obtient X « faces ». Calculez les probabilités 
suivantes : 


a) P(50<X< 60) b) P49<X<61) 
c) P(X= 54) d) P(X> 62) 
€) P(60 < X< 65) f) P(60,3< X< 65,9) 


Dans un certain cours, une note finale de 80 % assure un A. Une note de 
70 à 79 donne un B, une de 60 à 69 un C, une de 50 à 59 un D et une 
note inférieure à 50 mérite un E. 


Les notes des étudiants se conforment à une loi N(68, 225). Quelles 
proportions des étudiants devraient avoir un A ? un B ? un C? un D? 
un E ? 


Si X est une variable aléatoire normale, quelle est la probabilité qu'elle se 
situe : 


a) à moins d'un écart-type de la moyenne ? 
b) à moins de deux écarts-types de la moyenne ? 
c) à moins de trois écarts-types de la moyenne ? 


d) Comparez la probabilité obtenue en b) et c) avec la borne fournie par 
l'inégalité de Tchebychev. 


THÉORÈME 
LIMITE 
CENTRAL 


DIVERS 


16. 


17. 


18. 


19. 


20. 


21. 
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Les scores d'une population dans un test d'aptitudes sont distribués 
normalement avec moyenne LL = 60 et écart-type o = 8. Si votre score est 
de 76: 


a) Quelle est votre cote Z ? 

b) Quel pourcentage de la population a un score supérieur au vôtre ? 
c) Quel pourcentage de la population a un score entre 44 et 76 ? 

d) Quel pourcentage de la population a un score inférieur à 40 ? 


Soit X et Y deux variables aléatoires indépendantes, X de loi N(110, 25), 
Y de loi M100, 35). Calculez 


a) P(X+Y< 195) b) P(X- Y > 25) 
Soit X une variable de loi B(300; 0,30). Calculez : 
a) P(X2> 106) b) P(X > 74) 

c) P(X< 98) d) P(82 < X< 106) 

e) P(O8<X< 114) f) P(74< X < 82) 


Le poids des pêches dans un certain lot est de moyenne 127 grammes et 
d'écart-type 20 grammes. Quelle est la probabilité que le poids total de 
16 pêches soit supérieur à 2 200 grammes ? 


Soit X une variable avec fonction de densité : 


cx Si0<x<5 
FOX) = 
O0 sinon 


Quelle doit être la valeur de c? 

Soit X une variable aléatoire de loi B(6, 1/3). 

Déterminez P(X > 3), P<X<3)et PIX = 3): 

a) au moyen de la formule exacte donnant la fonction de masse. 
b) au moyen de l'approximation normale. 


c) au moyen de l'approximation par la loi de Poisson. 
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22. 


23. 


24. 


25. 


26. 


27. 


Certains câbles d'acier peuvent supporter une tension moyenne de 
2 120 kg (avec un écart-type de 100 kg) avant de briser. Pour soulever 
une lourde charge de 7 900 kg, on décide d'utiliser 4 câbles. Quelle est la 
probabilité que ce quadruple câble soulève la charge sans se briser ? 


Un jeu de 52 cartes ordinaires contient 12 figures (les valets, les dames 
et les rois). On tire 13 cartes du jeu. Calculez la probabilité que cette 
« main » contienne exactement 4 figures : 

a) au moyen de la loi hypergéométrique ; 

b) au moyen de la loi normale ajustée à LL et à o2. 

Supposons que les poids des adultes, en kilogrammes, sont d'écart-type 
12 kg. On prélève un échantillon de taille n pour estimer la moyenne 


inconnue y de la population par la moyenne échantillonnale X. Quelle 
est la probabilité que l'écart entre X et u soit supérieur à 5 kg si 


a) n=12 b) n=25 c) n=35 d) n=50 

Soit X une variable aléatoire de loi Exp(0). Quelle est la valeur de 0 si 
P(X > 5)=0,2? 

Un cultivateur sème des graines de haricot par rangs de 100 graines. On 
suppose que 80 % des graines germeront. 

a) Quel est le nombre moyen de plants obtenus par rang ? 


b) Quelle est la variance du nombre de plants obtenus dans un rang ? 


c) Quelle est la probabilité qu'un certain rang contienne plus de 
85 plants ? 


d) Quelle est la probabilité qu'un certain rang contienne moins de 
70 plants ? 


e) Le cultivateur a semé 20 000 rangs de haricots. Combien de ces 
rangs devraient, normalement, contenir moins de 70 plants ? 


f) Quelle est la probabilité que plus de 100 rangs contiennent moins de 
70 plants ? 


Lorsqu'une machine est réglée pour mettre 1 grammes de petits pois 
dans des boîtes de conserve, elle n'en met pas exactement 1 grammes. Le 
poids réel du contenu varie selon une loi normale de moyenne h et 
d'écart-type o grammes. 


28. 


29. 
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a) Siu = 300 et o = 4, quelle proportion des boîtes contiendront plus de 
310 grammes de petits pois ? 


b) Si = 4, à quelle valeur doit-on régler Lu pour que 1 % seulement des 
boîtes contiennent moins de 300 grammes ? 


Sondage : On veut connaître la proportion p des gens qui, dans la 
population générale, sont en faveur d'une certaine proposition. Dans un 
échantillon de n personnes, on obtient X réponses favorables à la 
proposition en question. Notons par p = X/n la proportion expérimentale 
de réponses favorables. 


a) Sin=100 et p= 0,5, déterminez P(p > 0,6). 

b) Sin= 100 et p = 0,4, déterminez P(p > 0,5). 

c) Si n = 100 et p = 0,4, déterminez approximativement c afin que : 
Pbp-c<p<p+cd+90%. 

d) Sin = 1000 et p = 0,4, déterminez approximativement c afin que : 
Pp-c<p<p+c=90%. 

e) Sip= 0,4, déterminez n afin que P(| p — [1 < 0,03) +9 0 % 

f) Sip= 0,2, déterminez n afin que P(| bp —- p| < 0,03) + 90 % 

g)  Sip= 0,5, déterminez n afin que P(| bp -p| < 0,03) + 90 % 

h) Déterminez n afin que P(| bp —- p| < 0,03) > 90 % pour toute valeur 
de p. 


Un terrain est découpé en 10 lots identiques. Sans engrais, la production 
de céréales, en tonnes, pour chaque lot, suit une loi N(6, 1). En utilisant 
un certain engrais, la production d'un lot sera de loi N(6,3; 1). Parmi les 
10 lots, 6 sont semés sans engrais et 4 reçoivent de l'engrais. 


a) Quelle est la probabilité que les lots sans engrais produisent, en 
moyennne, plus de 6,2 tonnes de céréales ? 


b) Quelle est la probabilité que les lots avec engrais produisent, en 
moyenne, moins de 6,2 tonnes de céréales ? 


c) Quelle est la probabilité que les 6 lots sans engrais produisent, en 
moyenne, plus de céréales que les 4 lots avec engrais ? 
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30. 


31. 


32. 


33. 


34. 


35 


On lance 20 pièces de 5 € et 10 pièces de 10 €. Soit X & la valeur totale 
des pièces qui donnent face. 


a) Déterminez E{X) et Var(X). 
b) Utilisant l'approximation normale, calculez P(X > 116). 


Le nombre de litres de peinture nécessaire pour un certain travail suit 
une loi N{1,1; 0,04). Est-il préférable d'acheter un format de 2 litres pour 
11 $ ou plutôt d'acheter un seul litre (pour 6 $), quitte à devoir retourner 
en acheter un second si nécessaire ? 


Deux archers s'affrontent dans un concours de tir à l'arc. À chaque tir, 
Xavier a 50 % de chance d'atteindre la cible. Légèrement plus habile, 
Yvon atteint la cible avec une probabilité de 60 %. Chacun tire 20 flèches 
et le vainqueur sera, évidemment, celui qui aura plus de coups au but. 
Utilisant l'approximation normale, calculez : 


a) la probabilité que Xavier ait plus de 13 coups au but ; 

b) la probabilité que Xavier gagne le tournoi ; 

c) la probabilité que Yvon gagne le tournoi; 

d) la probabilité d'un match nul. 

On lance 12 dés et on obtient, en tout, X points. 

a) Calculez E(X) et Var(X). 

b) Calculez, au moyen de l'approximation normale, P(30 < X < 50). 


Combien de fois doit-on lancer un dé si l'on veut que la moyenne des 
points obtenus ait 9 chances sur 10 de se trouver entre 3,0 et 4,0 ? 


. Xavier et Yvonne jouent à « pile ou face ». Xavier lance 10 pièces et 


Yvonne en lance 12. Le gagnant est celui qui obtient le plus de faces. 
a) Quelle est la probabilité que Xavier gagne ? 
b Quelle est la probabilité que Yvonne gagne ? 


c) Quelle est la probabilité d'un match nul ? 


36. 


37. 


38. 


39. 


40. 
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Le diamètre intérieur (en millimètres) d'un cylindre est une variable de loi 
N(10; (0,001)?). Le diamètre d'un piston est de loi N{(9,995; (0,002)?). 
Quelle est la probabilité qu'un cylindre et un piston s'accordent s'il faut 
que le cylindre soit plus grand que le piston et qu'il n'y ait pas plus de 
0,01 mm d'écart entre les deux diamètres ? 


Supposez que la durée en heures d'une ampoule est de loi exponentielle 
avec 6 = 1 000. 


a) Utilisez le théorème limite central pour calculer la probabilité que la 
durée moyenne de 300 ampoules soit inférieure à 1 100 heures. 


b) Calculez approximativement la probabilité que 130 ampoules ou plus 
dans un échantillon de 300 aient une durée de plus de 1 000 heures. 


Soit X une variable de loi exponentielle. Montrez que P(X > 3 | X > 2) 
= P(X > 1). Plus généralement, si a < b, montrez que P(X > b | X > à) 
= P(X > b- a). Interprétez. 


Un marchand assume la garantie d'un an qui accompagne la vente d'une 
certaine pièce électronique, ayant reçu du fabricant l'assurance que la 
durée de vie de ces pièces est de 2 ans en moyenne. Après quelque 
temps, il constate que sur 100 pièces vendues, il a dû en remplacer 40, 
un nombre qui lui semble excessif et lui fait douter de l'affirmation du 
fabricant. Supposez que le fabricant dit vrai et que la durée de vie est de 
loi exponentielle. 


a) Déterminez l'espérance du nombre de pièces qui doivent être 
remplacées. 


b) Calculez la probabilité d'avoir 40 pièces ou plus à remplacer. Vous 
semble-t-il encore vraisemblable que la durée moyenne de vie soit de 
2 ans ? 


Le contenu moyen H des boîtes de sauce aux tomates produites dans une 
usine peut varier d'un lot à l'autre, mais nous admettrons que 
l'écart-type reste fixe à environ 4 ml. 


a) Si, pour un lot donné, u = 200 ml, quelle est la probabilité que la 
moyenne d'un échantillon de 10 boîtes soit inférieure à 198 m1 ? 


b) Ne connaissant pas la valeur de u, on contrôle un lot de production 
en prélevant un échantillon de taille 10. Quelle est la probabilité que 
la moyenne de l'échantillon s'écarte de u de plus de 1 ml? 
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41. 


42. 


43. 


44. 


c) Supposons qu'on trouve trop forte la probabilité obtenue en b) : on 
souhaiterait que la probabilité d'un écart de plus de 1 ml ne soit que 
de 1 %. Quelle est la taille de l'échantillon qu'on devrait prélever ? 


d) La moyenne u doit être de 200 ml. Afin de s'en assurer, un inspecteur 
décide de prélever un échantillon de 10 boîtes et de suivre la règle 
suivante : si le poids moyen de 10 boîtes est inférieur à 198 mil, il 
rejette le lot (déclare que u < 200) ; sinon il l'accepte. Quelle est la 
probabilité qu'il rejette un lot pour lequel 1 = 200 ? 


e) Comment doit-on modifier la règle en d) si l'on veut que la probabilité 
de rejeter un bon lot (1 = 200) ne soit pas supérieure à 1 % ? 


Déterminez la probabilité qu'une variable de loi exponentielle se situe à 
plus de 2 écarts-types de sa moyenne. Comparez cette probabilité avec la 
borne donnée par l'inégalité de Tchebychev. 


Le poids du contenu des boîtes de conserves dans une certaine usine est 
de moyenne u = 300 g et d'écart-type 6 = 4 g. Soit X le poids moyen d'un 
échantillon de 8 boîtes. Calculez 


a) la probabilité que X soit supérieure à 302,83 g ? 


b) la probabilité que l'écart entre X et u (en valeur absolue) soit 
supérieur à 3 g ? 


Au numéro précédent, quelle est la taille minimale de l'échantillon qu'on 
devrait prélever pour que la probabilité d'un écart entre X et u de plus 
de 1 g soit inférieure à 0,05 ? 


Une succursale de banque reçoit régulièrement des dépôts sous la forme 
de rouleaux de 40 pièces de 25 €. Pour s'assurer que ces rouleaux 
contiennent bien 40 pièces, on décide de mesurer la longueur des 
rouleaux déposés et de rejeter ceux qui seraient trop courts. Afin de fixer 
un seuil de rejet on mesure l'épaisseur d'un très grand nombre de pièces 
de 25 €. On trouve que l'épaisseur moyenne d'une pièce est de 1,625 mm 
avec un écart-type de 0,16 mm. 


a) Supposons qu'on fixe le seuil à 64 mm ; on rejette un rouleau si sa 
longueur est inférieure à 64 mm. 


il Quelle est la probabilité de rejeter un rouleau qui contient 
40 pièces ? 


ii) Quelle est la probabilité d'accepter un rouleau qui ne contient que 
39 pièces ? 
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b) Supposons qu'on trouve la probabilité en ii) ci-dessus trop grande ; 
on souhaite plutôt que la probabilité d'accepter un rouleau qui ne 
contient que 39 pièces soit d'au plus 5 %. Comment doit-on modifier 
le seuil de rejet ? 


c) Avec le seuil de rejet choisi en b), quelle est la probabilité de rejeter 
un rouleau de 40 pièces ? Discutez les avantages et les inconvénients 
des deux seuils. 
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8.1 


Exemple 1 


ESTIMATION PONCTUELLE 


Si l'on veut connaître la proportion réelle des gens qui, dans une ville, une 
province où un pays entier ont une certaine caractéristique donnée, il est 
habituellement hors de question d'interroger un à un tous les individus 
composant la population : ce serait trop long, trop coûteux. On se contente 
alors d'analyser une partie seulement de la population : un échantillon. Si 
l'échantillon est convenablement choisi, il devrait refléter assez fidèlement les 
qualités de la population entière; la proportion des gens qui, dans 
l'échantillon, possèdent la caractéristique donnée (proportion expérimentale) 
devrait être voisine de la proportion réelle pour la population entière 
(proportion théorique). 


Plus précisément, si l'on note p la proportion réelle (inconnue) qu'on veut 
estimer, si l'on note n la taille de l'échantillon (c'est-à-dire : le nombre 
d'individus considérés) et si l'on note X le nombre d'individus qui, dans 
l'échantillon, possèdent la caractéristique qui nous intéresse, on a, en sup- 
posant la population pratiquement infinie, que X est de loi B{(n, p). 


La proportion expérimentale de « succès » sera notée p pour bien la 


distinguer de la proportion réelle p : 


_ X 
De 
n 
p est un estimateur de p, c'est-à-dire une quantité, issue des résultats 
expérimentaux, qui a la propriété d'approximer, numériquement, la valeur 
du paramètre inconnu p. 


Deux sondages différents, portant sur la même caractéristique, sont 
effectués. Dans le premier sondage, avec un petit échantillon de taille n=5, 
on a obtenu X = 8 (et p = X/n = 60 %). Le second sondage, avec un 
échantillon plus grand, de taille n = 1 000, a donné X = 600 (et p = 60 %). 


Ces deux sondages donnent-ils la même information ? Non, assurément ! Il 
va de soi que, même si les deux estimateurs ont pris la même valeur p = 
60 %, le second résultat est beaucoup plus précis, beaucoup plus fiable que 
le premier. D'avoir obtenu X = 3 avec n = 5 n'exclut absolument pas la 
possibilité que la valeur réelle de p soit, par exemple, 40 % alors que les 
résultats du grand sondage, avec n = 1000, permettent de rejeter 
catégoriquement cette possibilité. + 


254 


Introduction à la statistique appliquée 


La précision d'un estimateur dépend visiblement de la taille de l'échantillon 
utilisé. Nous y reviendrons dans la prochaine section. Pour l'instant, nous ne 
considérons que l'estimation ponctuelle, c'est-à-dire, la détermination d'un 
estimateur convenable pour un paramètre inconnu. 


Un bon estimateur doit posséder deux qualités naturelles : 


a) L'estimateur doit être sans biais (ou non biaisé). Un estimateur est sans 
biais si son espérance mathématique est égale à la valeur du paramètre à 
estimer ; ainsi, il n'aura tendance ni à surestimer ni à sous-estimer 
systématiquement la valeur du paramètre inconnu. On dit d'un 
estimateur sans biais qu'il est bien centré. 


b) L'estimateur doit avoir une variance aussi petite que possible, afin 
d'être aussi précis que possible. 

Dans l'exemple 1, la fréquence expérimentale p = X/n a servi d'estimateur 

pour le paramètre p d'une loi binomiale. On vérifie aisément que p est un 


estimateur sans biais pour p. En effet, 


. 1 1 1 
E(p)=E(-X)=—-E(X)=-npe=p. 


La variance de l'estimateur D est 


1 1 n 
Var(p) = Var(—X) = — Var(X) = TT - EE 
n n n n 


On remarque que plus nest grand, plus la variance de D, pq/n, est petite et, 


par conséquent, plus l'estimation sera précise, conformément à ce que 
l'intuition nous a déjà permis d'affirmer. 


Un autre paramètre relativement facile à estimer est la moyenne (théorique) 
u d'une loi normale. L'estimateur naturel de 1 est la moyenne expérimentale 
obtenue d'un échantillon X1, X2, …, Xn de taille n. On montre aisément que 
X est sans biais pour u. En effet, 


Exemple 2 
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_ 1 
E(X) = E(—2X.) 
n 


1 1 1 nu 
=_E(X )=-SE(X )=—(u+u+.+p)=—= 1. 
n n n n 


De même, comme on a déjà vu au chapitre 7, 
L 1 
Var(X) = Var(—2X) 
n 


Il l 2 2 2 l 2 : 
— — Var(2X,) L SAS +6 +..+0 )= Ne 
n n n n 
Plus nest grand, plus la variance de X , o2/n, est petite, ce qui est en accord 
avec notre intuition : plus nombreuses sont les observations, meilleures sont 
les chances que X soit près du Li. 


On suppose que l'âge X, en mois, d'un bébé lors de l'apparition de ses 
premières dents suit une loi Mu, 2) où u est inconnu. Ayant observé 8 bébés, 
on a obtenu les âges suivants : 


73 57 6,4 6,7 8,2 60 5,8 8,3 


La moyenne de ces 8 observations est X = 6,8 et, puisque la variance de 
chaque observation est de 2, la variance de X est 62/n = 2/8 = 1/4. L'écart- 


type de X est donc de 0,5. Si l'on avait disposé de 1 000 observations plutôt 
que de seulement 8, l'écart-type de Xaurait été de 42/1000 = 0,045 et 


l'estimation de u par X aurait été beaucoup plus fiable et plus précise. + 


Mise en garde Dans les applications concrètes, il faut évidemment prendre 
soin que l'échantillon utilisé ne soit pas choisi de telle sorte que l'estimation en 
soit grossièrement affectée. Par exemple, si l'on veut connaître la proportion 
des gens qui ont le téléphone, il est hors de question de choisir l'échantillon au 
hasard dans … le bottüin téléphonique. 


8.2 


ESTIMATION PAR INTERVALLE DE CONFIANCE 


Il peut s'avérer intéressant de savoir que p = 0,60 ou que X = 6,8 mais, 
sans aucune indication sur leur degré de précision, de telles estimations, 
purement ponctuelles, ne fournissent qu'une information partielle 
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concernant les valeurs réelles des paramètres p et u. Le fait d'avoir obtenu 
p = 0,60 nous incite à supposer que la véritable valeur de p est 
vraisemblablement voisine de 0,60. Est-on pratiquement certain que le 
véritable p se situe entre 0,59 et 0,61 ou, au contraire, y a-t-il de fortes 
chances qu'il ne se trouve même pas entre 0,40 et 0,80 ? 


L'estimation d'un paramètre inconnu n'est vraiment satisfaisante que si elle 
est présentée de telle façon qu'elle fournisse aussi une indication concernant 
son degré de précision. Rappelons qu'un estimateur (comme p ou X*) est 


une variable aléatoire et que plus la taille (n) de l'échantillon est grande, plus 
cet estimateur aura de chances de se trouver près de la valeur réelle du 
paramètre qu'il a pour but d'estimer. Si n est suffisamment grand, on sera 
pratiquement certain que l'erreur d'estimation (la distance entre p et p ou 


entre X et u) sera plus petite qu'un certain écart donné et que, par 
conséquent, la véritable valeur du paramètre qu'on veut estimer sera à 
l'intérieur d'un certain intervalle s'étendant de part et d'autre de la valeur 
prise par l'estimateur. Il reste à préciser, à quantifier ce qu'on entend par 
« être presque certain » ; il reste aussi à savoir déterminer les bornes de cet 
intervalle de confiance dans lequel on s'attend d'avoir « capturé » la 
véritable valeur du paramètre à estimer. 


En pratique, on convient à l'avance de courir un certain risque, noté « (lettre 
grecque alpha). Cette quantité à (habituellement, on choisit à = 1 %, 5 % ou 
10 %) représente la probabilité que l'intervalle qu'on obtiendra ne contienne pas 
la véritable valeur du paramètre qu'on cherche à estimer. La quantité 1 — «à est 
appelée le niveau de confiance de l'intervalle et indique la probabilité que le 
paramètre inconnu soit réellement à l'intérieur de l'intervalle qu'on obtiendra. 


Les bornes de l'intervalle de confiance seront deux quantités Y1, et Y2, 
calculées à partir des résultats expérimentaux (aléatoires) dont on dispose. 
En notant par 0 le paramètre à estimer, on veut avoir 


P(Y <8 <Y,)=1-a. 


Le couple (Y1, Y2) est un intervalle de confiance de niveau 1 - à pour le 
paramètre 6. Si, par exemple, on a convenu de fixer le risque à à 5 %, 
l'intervalle de confiance aura 95 chances sur 100 de contenir la véritable 
valeur du paramètre 6. 
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8.3 


ESTIMATION D'UNE PROPORTION 


Dans la première section de ce chapitre on a vu que la fréquence 
expérimentale p = X/n est un excellent estimateur (en fait, le meilleur) de la 


probabilité théorique p d'une loi binomiale. On a vu aussi que p est sans 


biais pour p et que sa variance est 


Si n est grand on aura, par le théorème limite central, que D est 
approximativement de loi M{p, 5) c'est-à-dire, 


PP 


est N(0,1). 
6. 
P 

Ayant convenu d'un risque à donné, on peut trouver, dans la table de la loi 
N(0, 1), un nombre c,, tel que 


PP 


PC: < Le.) l=c, 


O , 
è 


Utilisant ce c,, on aura 
P(p-co,<p<p+co,)s1-0. 
Pour obtenir un intervalle de confiance pour le paramètre p, il faut 


reformuler cette expression de telle façon que ce soit le paramètre p (plutôt 
que son estimateur p) qui soit isolé entre les deux inégalités. 


On obtient : 
P(B-c 56, <p<p+co,)=1-a. 


L'intervalle (pb + CS ;) a donc une probabilité (approximative) 1 —- à de 


contenir la véritable valeur de p. Il ne s'agit toutefois pas encore de 
l'intervalle de confiance désiré et ceci pour la simple raison que, tel 


qu'exprimé, il est incalculable. En effet, le terme O,= Jpa/n est fonction de 


la probabilité théorique p dont la valeur exacte est toujours inconnue. 
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Exemple 3 


Cette difficulté est heureusement facile à lever. Il suffit d'estimer à son tour 
la variance théorique 5; = pg/n par la valeur prise par son estimateur 


naturel 


On peut montrer rigoureusement que cette substitution est licite. En 
remplaçant l'écart-type théorique co; par son estimateur 6 5» on obtient 


enfin l'intervalle de confiance 
(tc,s,)=(p+c, /pa/n) 


qui est, approximativement, de niveau 1 - « pour le paramètre p. 


Lors d'un sondage auprès de 500 personnes et portant sur leurs opinions 
politiques, 180 personnes se sont déclarées favorables au parti A. Estimer la 
proportion théorique p des gens favorables au parti À au moyen d'un 
intervalle de confiance de niveau 90 %. 


Solution : On a p = X/n = 180/500 = 0,360. 
Aussi, pour avoir à = 10 %, on doit prendre c, = 1,645. 


Il ne reste plus qu'à employer la formule 


. pq 0,36 x 0,64 
p+c .— 1=|0,360 +1,645, | ——— 
n 500 


= (0,360 + 0,035) = (0,325; 0,395). 


+ 


Remarque À cause d'un conflit de notation avec l'emploi de la virgule décimale 
il convient, quand il y a risque d'ambiguité dans la présentation numérique 
d'un couple, de remplacer la virgule centrale par un point-virgule. 


Remarque C'est un abus de langage de prétendre qu'un intervalle de 
confiance numériquement déterminé a une probabilité de 1 - a de contenir le 
paramètre inconnu. Dans l'exemple 3, il serait abusif de conclure qu'il y a 
9 chances sur 10 que la valeur du paramètre p soit comprise entre 0,325 et 
0,395. Ce n'est pas le paramètre qui est aléatoire, ce sont plutôt les bornes de 
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l'intervalle de confiance. Une fois calculées, ces bornes ne sont plus des 
variables aléatoires. Il n'y a plus de hasard ! Prétendre que le paramètre p a 
9 chances sur 10 d'être situé entre tel et tel nombres donnés est une 
formulation fautive qui laisse entendre que p est une variable aléatoire, ce qu'il 
n'est pas. Rendu légitime par l'usage, cet abus de langage est habituellement 
toléré. 


Remarque La formule que nous utilisons ne donne que des intervalles de 
confiance symétriques, c'est-à-dire, qui partagent le risque a en deux moitiés 
égales. Le véritable p a donc une probabilité à/2 de se trouver à droite de 
l'intervalle (erreur de sous-estimation) et une probabilité a/2 de se trouver à 
gauche de l'intervalle (erreur de surestimation). Il peut arriver qu'on préfère 
partager le risque total a de façon non symétrique. Nous ne traiterons pas de 
ce cas ici et chaque fois qu'on parlera d'un intervalle de confiance, celui-ci sera 
implicitement supposé symétrique. 


Remarque Lorsqu'on estime un paramètre au moyen d'un intervalle de 
confiance, deux qualités espérées, précision et sécurité, sont en opposition. 
On ne peut améliorer l'une sans diminuer l'autre. Si l'on exige beaucoup de 
sécurité (risque « très petit), on obtiendra un intervalle de confiance plus large 
que si l'on se contente d'une sécurité plus raisonnable. Si l'on veut beaucoup 
de précision (intervalle étroit), il faudra « payer » cette précision par un risque 
d'erreur plus considérable. La seule façon d'obtenir à la fois une bonne 
précision et une grande sécurité est de ne pas lésiner sur la valeur de n, ce qui 
n'est pas toujours économique. 


Avec n = 100, on a obtenu p = 0,21. Calculer les intervalles de confiance de 
niveau 50 %, 10 %, 5 %, 1 % et 0,1 % pour p. 


Solution : Les cinq valeurs de à donnent des c,, qui valent, respectivement, 
0,674, 1,645, 1,960, 2,576 et 3,291. 


Les cinq intervalles de confiance sont présentés dans le tableau 8.1. 
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TABLEAU 8.1 


Exemple 5 


œ C; Intervalle de confiance Longueur 
50 % 0,674 (0, 18; 0,24) 0,06 
10 % 1,645 (0,14; 0,28) 0,14 
5% 1,960 (0, 13; 0,29) 0,16 
1% 2,576 (0,11; 0,31) 0,20 
0,1% 3,291 (0,08; 0,34) 0,26 


Lequel de ces cinq intervalles de confiance est le meilleur ? Assurément, un 
risque de 50 % est beaucoup trop fort et le premier intervalle n'est pas très 
satisfaisant. De même, un niveau de confiance de 99,9 % paraît exagéré et 
rend l'intervalle de 30 % plus large que celui obtenu avec à = 1 %. En 
général, on choisit à entre 1 % et 10 %, selon le contexte et l'importance 
relative de nos besoins en précision et en sécurité. + 


Si l'on sait déjà que la valeur du paramètre p est voisine de 0,15 %, combien 
d'observations doit-on effectuer pour que l'intervalle de confiance de niveau 
95 % pour p soit de rayon (ou demi-longueur) approximatif 0,05 ? 0,02 ? 
0,01 ? 


Solution : Puisque a/2 = 2 1/2 %, on doit prendre c, = 1,960. Le rayon de 
l'intervalle de confiance sera donc 1,960 Jpg/n. On ne sait pas à l'avance 


quelle sera la valeur de p mais on peut s'attendre à ce qu'il prenne une 


valeur voisine de p qu'on a supposé voisin de 0,15. Le rayon r de l'intervalle 
de confiance devrait donc être, approximativement, 


r +1,960./0,15x0,85/n =0,700/Vn. 


Exprimant n en fonction de r, on obtient n = 0,490/r2? et, en donnant 
successivement à r les valeurs 0,05, 0,02 et 0,01 on obtient, pour n, les 
valeurs 196, 1 225 et 4 900. + 


Remarque Dans l'exemple 5 on voit que, pour un niveau de confiance donné, 
le nombre d'observations requises est inversement proportionnel au carré de 
la précision désirée. Pour avoir une estimation dix fois plus précise, il faut cent 
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fois plus d'observations. Ce phénomène se manifeste dans presque tous les 
problèmes d'estimation, pas seulement dans le cas du paramètre p d'une loi 
binomiale. 


L'exemple 5 présente une situation passablement idéalisée : on y suppose 
qu'on connaît à l'avance la valeur (approximative) de p. Quand, dans la 
pratique, on veut déterminer le nombre d'observations requises pour que 
l'intervalle de confiance soit de la longueur désirée, on n'a pas toujours la 
chance de posséder une telle information préalable. Le mieux qu'on puisse 
faire est de se fier à son jugement, de se référer à des situations analogues 
déjà rencontrées. On peut aussi procéder à un présondage de petite taille qui 
aura pour seule fonction de fournir une estimation grossière de p grâce à 
laquelle il sera possible de déterminer la taille n qu'il faudra prendre pour le 
sondage principal. On peut aussi adopter une attitude conservatrice et 
choisir une valeur de n qui nous assurera que, quelle que soit la valeur de n, 
l'intervalle de confiance sera d'un rayon au plus égal à la précision désirée. 


Combien d'observations doit-on effectuer afin que, quelle que soit la valeur de 
P, l'intervalle de confiance de niveau 95 % pour p soit de rayon au plus 
0,05 ? 0,03 ? 0,02 ? O,01 ? 


Solution : Le rayon de l'intervalle de confiance de niveau 95 % est 
1,9604pq/n. 


Or, la valeur maximale possible pour pq est 1/4 (quand p= q= 1/2 Quelle 
que soit la valeur de p, le rayon maximum de l'intervalle de confiance égale 
Pas 1,960/V4n = 0,98/Vn . Pour avoir r < Fmax, il faut prendre n > (0,98 / rmax)2. 


En donnant successivement à "max les valeurs 0,05, 0,03, 0,02 et 0,01, on 
obtient n >385, n > 1068, n2>2 401 et n>9 604. 


Remarque Quand paraissent dans les journaux les résultats d'un sondage 
portant sur la popularité des différents partis politiques, il est souvent précisé 
que l'erreur d'estimation est d'au plus 3 %, 19 fois sur 20. Ce niveau de 
précision est en accord avec le fait que de tels sondages portent 
habituellement sur des échantillons de taille légèrement supérieure à 1 000. 
Pour les principaux partis (ceux dont la popularité est de l'ordre de 30 % ou 
50 %) cette erreur « maximale » de 3 % est correctement évaluée. Pour les partis 
marginaux, dont la popularité est de l'ordre de quelques points à peine, l'erreur 
vraisemblable est considérablement inférieure au 3 % déclaré. 
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8.4 


ESTIMATION D'UNE MOYENNE 


Cas général Soit X1, X2, …, Xn un échantillon de loi quelconque non spécifiée, 
pour laquelle la moyenne U et la variance o? sont inconnues. On veut estimer 
la moyenne théorique u au moyen d'un intervalle de confiance de niveau 1 - 
a donné. 


On sait déjà que, quelle que soit la loi de X, l'estimateur ponctuel ji = X est 
toujours sans biais pour u. On sait aussi que sa variance est 5 = 6 ? [n et le 


théorème limite central permet d'établir que, si nest grand, 


X est approximativement de loi N(u,o : ). 
Ayant convenu d'un risque à donné, on a donc 
P(u-c,6 > <X < n+c,6-)r1-0. 


où le terme c,, est obtenu de la table de la loi N(0,1). Isolant le paramètre u 
au centre des deux inégalités, on obtient 


P(X-c,o-<n<X+06-)r1-a. 


c 
a? ja donc une probabilité voisine de 1 — à de 


L'intervalle (X + 6,07)=(X+ 
n 

contenir la véritable valeur de u. Il ne s'agit cependant pas encore de 

l'intervalle de confiance désiré puisque, tel qu'exprimé, il est incalculable : la 


valeur de l'écart-type / Vn est inconnue et devra donc être estimée. 


Si la moyenne théorique u était connue, la variance 6° =E((X-u)°)pourrait 
être estimée par 


12 
=D -u). 
LE 


Puisque la valeur exacte de H est inconnue, il faudra, dans le calcul, la 
remplacer par la moyenne échantillonnale X. La variance o? peut donc être 
estimée par 


lu 2 
—Y(X, - X).. 


ni=1 
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Cet estimateur naturel a cependant un défaut : il est biaisé et a tendance à 
sous-estimer la valeur véritable de o2. On peut montrer (nous ne le ferons 
pas) que l'espérance de cet estimateur est 2<6 ? plutôt que le o2 désiré. Ce 
biais systématique est heureusement facile à corriger : il suffit de diviser 
EX, — X)?par n - 1 plutôt que par n. On obtient alors, pour o2 l'estimateur 


sans biais 


L'estimateur 6 peut s'exprimer sous plusieurs formes algébriquement 
équivalentes parmi lesquelles les plus commodes sont 


2 V72 = 
AT — nX si E x) 
n-1 n-1 


Revenons à l'estimation de li. 


On a déjà établi que l'intervalle (X+c,6-)=(X+c,o/Vn)a une probabilité 


1- «à (approximativement) de contenir la véritable valeur de nu. En y 
remplaçant l'écart-type théorique (inconnu) 6, par sa valeur estimée 6 (ou, 


ce qui revient au même, en remplaçant Re =o/Vn par (ge =6/Vn) on 


obtient l'intervalle de confiance 
(X+c,6.)=(X+0,6/Vn) 
qui est de niveau (approximatif) 1 - « pour . 


En vue d'estimer le nombre moyen de passagers par véhicule automobile 
(conducteur inclus) circulant sur une certaine autoroute, un observateur, 
installé à un poste de péage, a recueilli les données présentées dans le 
tableau suivant : 


Nombre de 
passagers 


Effectif 230 248 117 76 14 3 688 
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Estimer la moyenne théorique 1 au moyen d'un intervalle de confiance de 
niveau 95 %. 


Solution : Le nombre total d'observations est 688. Les effectifs donnés 
conduisent à ZX; = 1 469 et D 44 = 3 949, ce qui mène à Y = 2,135, 
c'=1,183et 6 = 1,088. 

Pour avoir à = 5 %, il faut prendre c, = 1,960 et l'intervalle de confiance pour 
u est 

(X+0,6 / Vn) = (2,135 +1,960 x1,088/26,23) = (2,135 0,081) 
= (2,054; 2,216). 
Cas où les observations sont de loi normale Pour estimer, par intervalle de 


confiance, la moyenne théorique u d'une loi quelconque non spécifiée, nous 
venons d'utiliser le fait que, pour n grand, 


KR) + x Cu | 
et — sont pratiquement de loi NO, 1). 
Sx S x 
Si l'échantillon X, X2, .…, Xn est formé de variables qui sont déjà de loi 


normale, on peut faire beaucoup mieux : on peut obtenir, pour u, un 
intervalle de confiance exact plutôt qu'approximatif, même pour des valeurs 
de n qui sont petites. 


Dans le cas où les variables Xi, X2, …, Xn sont de loi normale, on sait que 
leur moyenne X est aussi de loi normale et que 


X- 
E est exactement de loi N(0, 1). 


G — 
X 
En remplaçant, au dénominateur, l'écart-type théorique © (inconnu) par 
l'écart-type échantillonnal © , on obtient une nouvelle variable, 


X-—h 


x" qui n'est pas rigoureusement de loi normale. 
x 
Il s'agit d'une nouvelle loi, la loi de Student, et c'est dans une table conçue 
pour cette loi que sera trouvée la valeur de c,, telle que 
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Comme c'était le cas pour la loi fe: la loi de Student, notée t, est 


paramétrisée par un nombre de degrés de liberté v. Ici, v = n — 1. La loi t, 
ressemble beaucoup à la loi MO, 1). En fait, quand v est grand, ces deux lois 
s'avèrent pratiquement identiques. 


Le risque « étant convenu, le nombre c,, tel que P{t, > c,) = a/2 sera trouvé 
dans la table 4 de la page 399 à l'intersection de la ligne correspondant à v 
et de la colonne correspondant à a/2. Ce nombre c, ayant été obtenu de la 
table de la loi de Student, on a alors 


P(-cs,<YX-up<cé.)=1-0. 
Isolant LH au centre des inégalités, on obtient 
P(X-cé .<u<X+c8-)=1-0. 


L'intervalle de confiance de niveau 1 - à pour u est donc 


Remarquons que cette formule est rigoureusement identique à celle qui 
s'applique dans le cas d'une loi non spécifiée. La seule différence est la 
source du ©, qui provient de la table de la loi de Student (avec v = n- 1) 
plutôt que de celle de la loi MO, 1). 


Précisons que quand la loi de l'échantillon n'est pas spécifiée, on préfère tout 
de même prendre c, dans la table de la loi de Student plutôt que dans celle 
de la loi M0, 1). Si nest très grand (comme à l'exemple 7), les deux tables 
donneront pratiquement le même c, et le choix de la table importe peu. Sin 
est plus modeste, il vaut mieux utiliser le c, (légèrement plus grand, plus 
sécuritaire) fourni par la loi de Student. Mieux vaut utiliser la solution qui 
sera plus précise si les Xi sont vaguement de loi normale que celle qui est 
approximative dans tous les cas. 
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Exemple 8 


On veut connaître le temps moyen que dure une face de disque microsillon. 
Ayant chronométré 5 disques (10 faces), on a obtenu les résultats suivants 
(en minutes) : 


17,5 22,4 18,6 24,3 19,5 
21,6 15,9 20,4 18,7 20,3 


Supposant que ces variables sont de loi normale, calculer l'intervalle de 
confiance de niveau 90 % pour lu. 


Solution : Les données expérimentales donnent ZX, = 199,2 et 
EX? =4 022,02. On trouve donc X= 19,92 et 6° = (EX? -nX°)/(n-1)= 
5,995 1. 


Avec a = 10 % et v = n - 1 = 9, la table de la loi de Student donne c, = 1,833. 
L'intervalle de confiance pour u est donc 


_ cé 1,833/5,995 1 
(r258)-fio00s }-uvrs1 


n 10 


= (18,50; 21,34). 


Avec l'abus de langage habituel, il y a donc 90 chances sur 100 que la 
véritable valeur de u se trouve entre 18,50 et 21,34. 


8.5 


ESTIMATION D'UN PARAMÈTRE 6 QUELCONQUE 


Dans les sections 8.3 et 8.4 nous avons traité de l'estimation, par intervalle 
de confiance, d'une probabilité théorique (p) ainsi que d'une moyenne 
théorique (u). Dans chacun de ces cas nous avons obtenu, essentiellement, 
des intervalles de confiance de la forme 


6 + cé) 


où 6 était l'estimateur naturel pour le paramètre 0 qu'on voulait estimer, où 
Cu, était obtenu de la table de la loi NO, 1) en fonction du niveau 1 - « désiré 


et où 6 : était un estimateur de 6 . = Var (6). 


Dans la grande majorité des cas, l'estimation d'un paramètre 0 pour une loi 
quelconque se fait de la même façon. Il suffit de trouver un estimateur 


Exemple 9 


Exemple 10 
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convenable 6 dont la variance a peut être estimée. Très souvent, 64 peut 
s'exprimer en fonction de 6 et l'estimateur 6 . s'obtient alors en remplaçant 
simplement 6 par 6 dans la formule qui exprime 6 - en fonction de 6. 

C'est précisément ce qui a été fait lors de l'estimation du paramètre p d'une 

loi binomiale. On a utilisé l'estimateur p = X/n dont la variance 5; = pq/n a 
x s > A2 x À 

pu être estimée par GS, — pqa/n. 


Si, pour n grand, l'estimateur 6 se comporte normalement (ce sera le cas, par 
exemple, s'il est fonction de la somme des Xj), la formule générale 


(é Æ CALE ) fournira l'intervalle de confiance désiré. 


Soit X1, X2, …, Xn, un échantillon de loi Exp(8). Déterminer la formule 
donnant l'intervalle de confiance pour €. 


Solution : Puisque E(X) = 6, l'estimateur naturel à utiliser est Û = X, qui est 


sans biais pour 6. Puisque Var(X) = 62, la variance de X est 6: = 02/n, qui 
peut être estimée par 6 = 6? /n : X°/n . On obtient donc, pour 6, l'intervalle 


de confiance (0 + CG) =(XE cX/Vn) ° 


Soit X1, X2, .…, Xn un échantillon de loi Poisson (A). Déterminer la formule 
donnant l'intervalle de confiance pour À. 


Solution : Puisque E(X) = X, l'estimateur naturel à utiliser est À=X, qui est 


sans biais pour À. Puisque Var(X) = À, la variance de X est 62 =}/n, qui 
peut être estimée par 0 = X/n = X/n. On obtient donc, pour À, l'intervalle 


de confiance ŒA+cs.)=(X+c, JX/n). + 
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RÉSUMÉ 


Qualités d'un bon estimateur ponctuel : 
a) Être sans biais pour le paramètre considéré. 
b) Avoir une petite variance. 


Intervalle de confiance : Couple de variables (Y:1, Y2), obtenues de l'échantillon, 
tel que P(Y1 < paramètre < Y2) = 1 - 0. 


. Paramètre Intervalle de 
Loi Source du c, 
estimé confiance 
Binomiale (n grand) P (p+c, JF) Loi M(0, 1) 
Loi non spécifiée Fi 9 Loi t, de Student 
H (A+ =) = 
(n grand) # avecv=n-l 
Loi normale Fi us Loi t, de Student 
: u (X + =) 
(solution exacte) # avecv=n-l 
Loi quelconque o «é £c 6.) Loi MO, 1) 
(n grand) ; 
o EX -X) EX? -nX on — À, 
Go = - = — = (X° -X") 
n-1 n-1 n-1 
EXERCICES 
ESTIMATION 1. Soit X1, X2, …, Xn un échantillon de loi Exp(0). Montrez que la moyenne X 
PONCTUELLE est un estimateur sans biais pour 6 et que sa variance est 0” 4 n. 
2. Soit X1, X2, …, Xn un échantillon de loi Poisson(A). Montrez que la 


moyenne * est un estimateur sans biais pour À et que sa variance est 
À/n. 


ESTIMATION PAR 
INTERVALLE DE 
CONFIANCE 


ESTIMATION D'UNE 


PROPORTION 
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Considérons un échantillon X;, X, de taille n = 2. 


a) Montrez que chacun des trois estimateurs suivants est sans biais 
pour 6 = x. 


Dex CE) 0 0e Sr AE. 


b) Déterminez la variance de chacun de ces trois estimateurs (en 
fonction de 6.) Quel est le plus précis pour estimer Lx ? 


Si, pour estimer un certain paramètre 0, on utilise un estimateur 0 qui 


est de loi N(6, 1/100), quelle est la probabilité que l'intervalle (o + 0,2) 
contienne la véritable valeur de 6 ? 


On veut connaître la proportion d'oranges gâtées dans un lot d'oranges. 
Un échantillon de 300 oranges contenait 18 fruits gâtés. Estimez p au 
moyen d'un intervalle de confiance de niveau 90 %. 


Lors d'un sondage auprès de 1 000 personnes et portant sur leurs 
opinions politiques, 410 personnes se sont déclarées en faveur du parti 
À, 342 personnes ont favorisé le parti B, 78 personnes ont préféré le parti 
C et les autres (170) se sont déclarées indécises. Calculez un intervalle 
de confiance de niveau 95 % pour chacune des quatre proportions. 


Durant la saison 1988, le joueur de baseball Tim Raïnes, qui joue pour les 
Expos de Montréal, a frappé 116 coups sûrs en 429 présences au bâton, 
ce qui lui a donné une moyenne de 0,270. Estimez sa moyenne véritable 
(théorique) au moyen d'un intervalle de confiance de niveau 95 %. 


Un volume traitant du jeu d'échecs contient 360 parties de grands 
maîtres. Parmi ces parties, 172 ont étés gagnées par les blancs, 103 par 
les noirs et 85 parties ont été nulles. Estimez, par des intervalles de 
confiance de niveau 90 %, les trois probabilités considérées. 


On sait qu'une probabilité p est plus difficile à estimer quand elle est 
près de 1/2 car cette valeur de p maximise pq qui vaut alors 1/4. Pour 
a = 1 %, 5 % et 10 %, déterminez le nombre n d'observations qui assure 
que la distance entre p et pb sera inférieure à 0,10 ; 0,05 ; 0,02 ; 0,01 
avec une probabilité au moins égale à 1 — a. Il y a 3 x 4 = 12 cas à 
considérer. Trois de ces cas ont été traités dans l'exemple 6. Présentez les 
12 résultats dans un tableau. 
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ESTIMATION DUNE 10. Un archer a tiré 20 flèches vers une cible. Selon la précision du tir, 


MOYENNE 


ESTIMATION D'UN 
PARAMÈTRE 6 
QUELCONQUE 


11. 


12. 


15. 


14. 


chaque flèche donne plus ou moins de points. En ses 20 lancers, l'archer 
a obtenu une seule fois 5 points, 3 fois 3 points, 7 fois 2 points, 7 fois 1 
point, et a raté 2 fois la cible (aucun point). Estimez, par un intervalle de 
confiance de niveau 90 %, la moyenne théorique H de points qu'il obtient 
à chaque tir. 


Un éleveur de lapins veut connaître le nombre moyen u de lapereaux qui 
sont produits par portée. Au cours des quelques derniers mois, 240 
lapines ont mis bas, donnant, en moyenne 6,13 lapereaux, avec un 
écart-type de 1,31. Estimez u au moyen d'un intervalle de confiance de 
niveau 95 %. 


Un fabricant de pneus d'automobile veut connaître la qualité de sa 
production. Dix pneus ont été soumis à des épreuves de résistance à 
l'usure. Les résultats (en milliers de kilomètres parcourus) sont 


95, 108, 86, 92, 94, 101, 79, 89, 91 et 96. 


Calculez un intervalle de confiance de niveau 90% pour la durée 
moyenne d'un pneu. 


Un organisme de protection du consommateur étudie la qualité de 
différentes marques de piles de lampe de poche. Plusieurs piles ont été 
soumises à une même épreuve où l'on mesurait leur temps de service. 


12 piles de marque À ont duré en moyenne 3,42 heures, avec un 
écart-type de 0,39. 

8 piles de marque B ont duré en moyenne 4,16 heures, avec un 
écart-type de 0,82. 

2 piles de marque C ont duré en moyenne 4,02 heures, avec un 
écart-type de 1,04. 

30 piles de marque D ont duré en moyenne 2,95 heures, avec un 
écart-type de 0,53. 


Calculez un intervalle de confiance de niveau 90 % pour chaque 


moyenne. 


Dans le service d'obstétrique d'un certain hôpital, on a enregistré 472 
naissances durant les 100 derniers jours. En supposant que le nombre 
de naissances par jour suit une loi Poisson(A), estimez À au moyen d'un 


intervalle de confiance de niveau 95 % (estimez À par k=X ). 


DIVERS 


*15. 


*16. 


17. 


*18. 


*19. 


*20. 


*21. 
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Soit X une variable aléatoire de loi B(n, p) où p est connu. On veut 
estimer le nombre d'essais n. L'estimateur naturel est 7 = X/p, qui est 


sans biais. 
a) Déterminez la formule donnant l'intervalle de confiance pour n. 


b) En nlancements d'un dé, la face « 6 » a été obtenue 25 fois. Estimez n 
au moyen d'un intervalle de confiance de niveau 90 %. 


Une assemblée de 300 personnes vote pour se désigner un président. 
Deux candidats, À et B, sont en lice. Après dépouillement partiel de 200 
bulletins de vote (parmi 300), on constate que À a reçu 106 votes et Ben 
a eu 94. Estimez, au moyen d'un intervalle de confiance de niveau 90 % 
le nombre total de votes qui iront au candidat A. (Suggestion : utilisez 
l'approximation normale pour la loi hypergéométrique). 


Soit X1, X2, …, Xn un échantillon de loi U{0, 8). On pose D=2x. Cet 
estimateur est-il sans biais pour 0 ? Quelle en est la variance ? Cet 
estimateur n'est pas le meilleur (voir problème 22). 


Soit X1, X2, …, Xn un échantillon de loi Géom{p). Déterminez un 
estimateur convenable pour p. 


Suggestion : Déterminez d'abord un bon estimateur pour 1/p. 


Soit X une variable aléatoire de loi uniforme U(0, 6). Montrez que 


(22, 9) est un intervalle de confiance de niveau 1 - a et pour 6. 
Soit X1, X2, …, Xn un échantillon de loi Mu, 4). Quel est le niveau de 


l'intervalle de confiance (X - 1, X + 1), pour u, sin=4?sin= 16? si 
n= 36? 

Soient 6, et © , deux estimateurs, chacun sans biais, pour un même 
paramètre 6. 


a) Montrez que, pour toute valeur de c, l'estimateur combiné 


6 = cô, +(1- c)6, est aussi un estimateur sans biais pour 6. 


b) Si Le et 6, sont indépendants (par exemple, proviennent d'échan- 


. os L 2 . 2 2 
tillons différents), exprimez co, en fonction de ir Ci» et c. 
1 2 


2 


Remarque On peut montrer que c'est en prenant c=0? /(5? +02 ue 
6 6 D 3.4? 
2 1 2 


54 est minimisée. 
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#22 


23. 


24. 


25. 


26. 


Soit X1, X2, …, Xn un échantillon aléatoire de loi uniforme U{0, 8). Posons 
Y = max{ X1, X2, …, Xn}. 


a) Utilisant le fait que E(Y) = 6, de quelle façon peut-on utiliser Y 


n+1 


pour définir un estimateur 80 qui soit sans biais pour 0 ? 


b) Utilisant le fait que Var(Y) = ie 


—"—— , quelle est la variance de 
(n+1)° (n+2) 


l'estimateur 6 obtenu en a) ? Cet estimateur est-il meilleur que celui 
présenté au problème 17 ? 


n dés ont été lancés et ont donné, en tout, 117 points. Estimez n au 
moyen d'un intervalle de confiance de niveau 90 %. 


En employant les données de la section 1.4, page 15, déterminez un 
intervalle de confiance pour la probabilité qu'un enfant naïisse lors de la 
pleine lune. 


On prélève un échantillon de 20 paquets de petits pois de format 400 g et 
on en pèse le contenu. Voici les résultats : 


402 398 398 397 401 
394 399 397 399 396 
401 398 400 399 402 
398 397 394 401 398 


Supposons que vous travaillez pour une association de consommateurs 
et que vous soupçonnez le fabricant d'avoir volontairement réduit le 
contenu des paquets. Sachant que le fabricant produit 100 000 paquets 
par année, et que 1 kg de petits pois lui coûte en moyenne 30 €, estimez 
le montant d'argent épargné annuellement avec ses pratiques 
frauduleuses. Entourez votre estimation d'un intervalle de confiance de 
niveau 95 %. 


L'une des tâches d'une usine consiste à peindre des grands panneaux de 
6 m? de surface. On a toujours employé une peinture qui coûte 
actuellement 4 $ le litre. Son pouvoir couvrant est bien connu, car au 
cours des années on a peint 10 000 panneaux et on sait qu'il a fallu 
employer 7 500 litres de peinture pour le faire. Il est question maintenant 
d'adopter une nouvelle peinture, dont le prix est de 4,50 $ le litre, mais 
dont le pouvoir couvrant est possiblement supérieur. 


TABLEAU 8.3 


27. 


*28. 
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Avec la nouvelle peinture, on peint 10 panneaux, et on mesure avec soin 
la quantité de peinture employée pour chacun. Voici les résultats, en 
litres : 


0,65 0,62 0,58 0,54 0,56 
0,52 0,53 0,59 0,63 0,61 


a) Déterminez un intervalle de confiance pour la quantité moyenne de 
nouvelle peinture requise pour peindre un panneau (prendre 
a = 5 %). 


b) Déterminez un intervalle de confiance pour l'épargne moyenne par 
panneau qui résulterait de l'emploi de la nouvelle peinture (prendre 
a = 5 %). 


c) Déterminez un intervalle de confiance pour le montant de l'épargne 
annuelle si on peint 2 000 panneaux par année (prendre à = 5 %). 


Dans un échantillon de 300 hommes, on a trouvé 90 fumeurs. Dans un 
autre échantillon, formé de 100 femmes, on a trouvé 20 fumeuses. 


a) Estimez, par des intervalles de confiance de niveau 95 % chacune des 
proportions pr et ps de fumeurs chez les hommes et chez les femmes. 


b) Utilisant le fait que les hommes forment 49,3 % de la population (et 
les femmes 50,7 %), estimez la proportion p de fumeurs dans la 
population. Déterminez OC) ô ; € déterminez un intervalle de 


confiance de niveau 95 % pour p. 


Pour chacun de 15 couples mariés choisis au hasard on a observé l'âge 
de l'époux (X) et l'âge de l'épouse (Y). On a obtenu les données du tableau 
suivant 


X (époux) Y (épouse) X (époux) Y (épouse) X (époux) Y (épouse) 
37 32 39 28 61 55 
65 64 25 22 43 42 
23 23 40 43 52 47 
36 37 45 39 34 33 


54 51 31 30 48 51 
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On veut estimer la différence moyenne 0 = 1x — uy entre l'âge d'un époux 
et celui de son épouse (par un intervalle de confiance de niveau 90 %). 


a) Posez W= X - Yet calculez les 15 valeurs de Wi. Estimez 0 par ô = 


W et 54 par Des Quel intervalle de confiance obtenez-vous ? 


b) Un statisticien amateur estime 6 par 0 =W-Y et 54 par 5: + LES 
Comparez l'écart-type © 6 qu'il utilise avec celui obtenu en a). Quelle 


erreur a-t-il commise ? 


Tests d'hypothèses 


9.1 
9.2 


9.3 
9.4 


9.5 


Test d'hypothèse sur une proportion 

Test sur l'égalité de deux proportions 

e Cas où les données sont appariées 

Test d'hypothèse sur une moyenne 

Test sur l'égalité de deux moyennes 

e Cas où les variances sont supposées égales 
e Cas où les données sont appariées 

Test d'hypothèse sur un paramètre 6 quelconque 
e Test sur l'égalité de 86,et6, 

RÉSUMÉ 

EXERCICES 
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Introduction Nous avons déjà traité, dans les premiers chapitres, de certains 
tests d'hypothèse : les tests basés sur le calcul de y? ou sur celui du 
coefficient de corrélation r. Chaque fois, une hypothèse (appelée hypothèse 
nulle et notée Ho) était émise et on se permettait de la rejeter si les résultats 
échantillonnaux s'écartaient trop de ce que l'hypothèse permettait de prévoir. 


Nous allons maintenant étudier les tests d'hypothèse de façon plus 
systématique, sans manquer l'occasion d'en mettre en lumière les 
mécanismes méthodologiques. Il n'est peut-être pas inutile en effet de 
rappeler que toute démarche scientifique (et cela s'entend aussi bien des 
sciences physiques que des sciences humaines) procède selon le même 
schéma : énoncé d'une hypothèse, collecte de données expérimentales qui 
constituent l'échantillon, acceptation ou rejet de l'hypothèse à partir de la 
comparaison entre les données de l'échantillon et les résultats prédits par 
l'hypothèse. Tirée de considérations et de calculs probabilistes, la conclusion 
est assortie d'une marge d'erreur, dont on fixe le seuil au départ. 


Ce chapitre est donc au cœur de ce manuel, comme la matière qu'il traite est 
au cœur de la statistique. Hors son importance dans toute démarche 
expérimentale, il est aussi l'occasion d'utiliser à fond les techniques 
mathématiques développées dans les chapitres précédents et (nous 
l'espérons) de mieux en apprécier le contenu et la portée. Nous développons 
maintenant l'exemple d'une situation qui va nous permettre d'illustrer les 
idées et de faire la synthèse des techniques propres aux tests d'hypothèse. 


Nous allons donc supposer qu'une conserverie met sur le marché des boîtes 
de petits pois, dont l'étiquette indique que le contenu pèse 400 g. Soucieux 
de l'image de la compagnie — et de sa marge de profit — le directeur de la mise 
en marché se propose de vérifier si le poids réel est bien tel que prétendu. Il 
procèdera alors selon les grandes étapes suivantes : 


1. Énoncer clairement une hypothèse à tester. Bien entendu, son hypothèse 
ici est que le poids moyen u de toute sa production (la population) est de 
400 g. Ho : u = 400 g. En général, les tests simples usuels sont de ce 
type : ils proposent une hypothèse qui attribue une valeur déterminée au 
paramètre étudié. 


Ho : 0 = 66. 
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2. Se donner un risque d'erreur (a). Au-delà d'un certain contenu intuitif, ce 
nombre «à a d'abord un sens mathématique, de nature probabiliste, que 
nous précisons plus loin. 


3. Tirer un échantillon de la population en général et, ici, de la production 
totale. Comme nous le verrons au chapitre 10, il y a diverses façons de le 
faire ; dans tous les cas, un échantillon devra être un reflet fidèle de la 
population. 


4. Calculer un estimateur du paramètre. Ici, il s'agira de l'estimateur de lu, le 
poids moyen X des boîtes dans l'échantillon. En général, on notera e) 
cet estimateur pour le paramètre 0 étudié. 


5. Étudier l'écart entre 60 et 8. Si cet écart est grand, l'hypothèse Ho sera 
rejetée ; si cet écart est petit, l'hypothèse sera acceptée (ou non rejetée). 


La délimitation précise des mots « petit » et « grand » dépend du risque à 
et est évaluée par un calcul de probabilité. De façon globale, un intervalle 
est formé autour de 60 et l'on convient que les valeurs de 6 à l'intérieur 
de cet intervalle sont « proches » de 60 (région d'acceptation de 
l'hypothèse) ; les valeurs de 6 hors de cet intervalle mènent au rejet de 
l'hypothèse. 


acceptation de Ho 


6 


écart trop grand entre ô et 6; 


6. Tirer une conclusion. On aura donc rejeté Ho ou été dans l'impossibilité de 
le faire ; dans ce dernier cas, on affirme, en général, avoir accepté Hb. 
Selon le cas, deux types d'erreur sont possibles : on peut rejeter Ho même 
si elle est vraie (risque a), ou encore on peut accepter Ho, alors qu'elle est 
fausse. Ce second type d'erreur est plus malaisé à évaluer, puisqu'il 
dépend du « degré de fausseté » de Ho. Ces deux risques d'erreur sont, en 
général, opposés : plus on prend a petit et plus l'on court de risques 
d'accepter une hypothèse nulle fausse ; inversement, si l'on prend a trop 
grand, on risque de rejeter une hypothèse nulle vraie. 


Pour en terminer avec les petits pois, on voit donc que selon la valeur 
observée de X , celui qui mène l'expérience 
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e ou bien rejettera Ho et conclura que les boîtes sont trop lourdes ou trop 
légères ; peut-être fera-t-il recalibrer la chaîne de production (ou réécrire 
les étiquettes .… ). Dans tous les cas, s'il se trompe il occasionnera à la 
compagnie des frais inutiles ; c'est cette erreur qui a probabilité « ; 


e ou bien ne rejettera pas Ho et conclura que le poids marqué est vraisem- 
blablement correct. Il risque alors de continuer à inonder le marché de 
boîtes trop lourdes (pertes importantes) ou trop légères, abusant de la 
bonne foi des consommateurs. La probabilité de ce type d'erreur n'est 
pas contrôlée. 


Maintenant, nous allons voir comment ces principes généraux s'appliquent 
dans des cas particuliers. 


9.1 


Exemple 1 


TEST D'HYPOTHÈSE SUR UNE PROPORTION 


En 10 000 naissances, on a observé 4 852 filles (et 5 148 garçons). 
L'hypothèse d'équiprobabilité (p = 1/2) est-elle vraisemblable ? 


Solution : L'hypothèse nulle, si elle est vraie, est telle que le nombre X de 
filles doit être de loi B(10 000, 1/2), c'est-à-dire de loi approximativement 
N(5 000, 2 500). La valeur observée, X = 4 852, est à près de 3 écarts-types à 
gauche de L, valeur statistiquement incompatible avec l'hypothèse nulle qui 
est rejetée. 


Le même test aurait pu être obtenu en calculant la valeur de p. Sous 
l'hypothèse nulle, p devrait être de loi M1/2, pq/n) = N1/2, 1/40 000). 


Encore une fois, la valeur de p = 0,485 2 se trouve à près de 3 écarts-types 
à gauche de u = 1/2. L'hypothèse nulle est à rejeter. 


On aurait pu aussi utiliser le test du khi-deux, vu au chapitre 1. L'hypo- 
thèse, encore, aurait été rejetée. + 


Présentée dans un cadre plus général et plus formel, la situation est la 
suivante : on observe une variable X de loi B{n, p) où n est connu et p est 
inconnu. On émet l'hypothèse nulle Æ : p = po Où po est un nombre donné. 
On convient à l'avance d'un risque a. On sait déjà que, si Ho est vraie, 
p = X/n sera approximativement de loi NM{po, Pogo/n) où do = 1 — Po. 
Autrement dit, si H est vraie, on aura que : 


Exemple 2 
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_ Vn(b-p5) 


Po 


Z sera approximativement de loi M{O, 1). 


L'hypothèse nulle sera rejetée si Z est trop grand ou trop petit, c'est-à-dire si 
Zest hors de l'intervalle (-c,, c) où c, est tel que P(-c, < M0, 1) < c, = 1-0. 


H est rejetée si |Z| > &; 


Ho est accepté si |[Z| < c. 


Cette procédure peut être aussi présentée sous la forme : 


NE | 
Vn 
c 


, 


Ho est rejetée si | p-p, |> 


do 
: a VPo4 
Hb est acceptée si | p-p, |< SELS 


Vn 


On émet l'hypothèse que 25 % des gens, dans la population, sont gauchers. 
Tester cette hypothèse avec un risque à = 10 % en utilisant le fait qu'un 
échantillon de 120 personnes a donné 18 gauchers. 


Solution : On a ici po = 0,25, p = 18/120 = 0,15. 


Aussi, puisque à = 10%, on prend C, = 1,645. On obtient donc que 


c, JPod0 / Vn = 0,065. 


Puisque | p — po| = [0,15 —- 0,25] = 0,10 > 0,065, on doit rejeter l'hypothèse 
nulle. En conclusion, la proportion véritable de gauchers n'est pas 25 % ; 
elle est vraisemblablement plus petite. + 


Remarque L'hypothèse nulle Ho : p = po peut aussi être testée au moyen de 
x7 =2(0-T)°/T. Dans l'exemple 2, on a O1 = 18, O2 = 120 - 18 = 102, 
T1 = 120po = 30, T2 = 120qo = 90 et on trouve 4? = 6,4. On peut montrer que x? 
est algébriquement équivalent au carré de Z = (p -po}/{p,q,/n et observer 
que le point critique pour y?, 2,706, est exactement le carré du point critique 


utilisé pour Z, soit 1,645. Les deux tests sont donc rigoureusement 
équivalents. 


280 Introduction à la statistique appliquée 


Remarque En utilisant les données de l'exemple 2 on obtient, pour p, 


l'intervalle de confiance (bte, Vian) = (0,096; 0,204). La valeur po = 0,25, 


proposée par l'hypothèse nulle, n'est pas dans l'intervalle de confiance : 
l'hypothèse nulle est donc rejetée. Il convient d'observer que, dans le calcul de 
l'intervalle de confiance, l'écart-type de p,5; =/pq/n, a été approximé par 
5; = Jpq/n alors que, pour le test, on utilise plutôt la valeur /p,q,/n.1l peut 


donc arriver que, dans certains cas où la décision est serrée, les deux 
méthodes ne mènent pas rigoureusement à la même conclusion. 


9.2 


Exemple 3 


TEST SUR L'ÉGALITÉ DE DEUX PROPORTIONS 


Lorsqu'on considère deux populations différentes, le problème se pose 
souvent de savoir si ces deux populations admettent une même distribution 
commune. C'est en comparant deux échantillons, issus de chacune de ces 
populations, qu'on pourra accepter ou non l'hypothèse selon laquelle les 
distributions sont identiques. 


Si aucune supposition n'est faite concernant la forme des distributions 
comparées, le test d'indépendance basé sur le calcul de y? vu au chapitre 3, 
permet d'atteindre une conclusion. Si, comme c'est souvent le cas, on sait à 
quel genre de loi on a affaire (loi binomiale, par exemple) il vaut mieux tirer 
profit de cette information et utiliser un test dans lequel on compare 
directement les estimateurs des paramètres qu'on obtient de chacun des 
échantillons. 


Dans son édition du 30 mars 1987, la revue TIME rapportait les résultats 
d'une étude effectuée par des chercheurs de l'Université du Maryland et de 
l'Université de Pennsylvanie et qui portait sur le taux de mortalité de 
92 patients atteints de troubles cardiaques sérieux. 53 de ces patients 
possédaient un animal familier (chien, chat, poissons rouges, … ) ; 3 de ces 
patients ont survécu moins d'un an. Parmi les 39 patients qui ne 
possédaient pas d'animal familier, 11 sont décédés durant la même période 
d'un an. Les probabilités de décès sont-elles égales pour les deux groupes ? 
Les résultats expérimentaux donnent bp = 3/53 = 0,057 pour ceux qui 
possèdent un animal et p = 11/39 = 0,282 pour ceux qui n'en ont pas. 
Compte tenu des tailles des deux échantillons, l'écart est-il significatif ? 
Nous y reviendrons plus loin, quand nous aurons développé un test qui 
permettra de répondre à cette question. + 
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Considérons deux variables aléatoires X et Y, chacune de loi binomiale, X est 
B(nx, px) et Y est B(ny, pr. On veut tester l'hypothèse 


Ho : px = pr. 


On sait déjà que p, et p, peuvent être estimés par les fréquences 
échantillonnales p, =X/n, et p, =Y/n,. C'est en comparant p, et p, 


qu'on pourra détecter si les paramètres px et py sont égaux ou non. 
L'hypothèse selon laquelle ils sont égaux sera rejetée si la distance entre p, 


et p, est significativement grande. 


On sait déjà que, si les tailles nx et ny des deux échantillons sont grandes, 


alors 


p, est approximativement de loi N(p, CF )où 6 5 PLALS 
X X n 
X 
: . : : 2 .. 2 _ Pyqy 
et p, est approximativement de loi N(p, 6; joù GE = + 
Y Y n 
Y 


Puisqu'ils sont issus de deux échantillons différents, les estimateurs p x €t 


p, sont indépendants et on obtient que : 


x ï : : | 2 2 
px — p,est approximativement de loi N(p, -p, ,6 PELLE ), 


ce qui entraîne que 


Pi rh be Pr) est approximativement de loi NO, 1). 


Les variances 5$ et 5$ , qui paraissent au dénominateur, peuvent être 
X Y 
. 2 A 2 An A ñ 2 1 A . . 
estimées par Le =p,q,/n, et cs =p,q,/n, et on obtient, si n, et n,sont 


grands, 
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Exemple 4 


Exemple 5 


ps -py —(Px —Py) 
= 22 


G: 4. RO: + 
Px Py 


est approximativement de loi N{O, 1). 


Si l'hypothèse Ho : px = py est vraie, le terme (px - p,), qui paraît au 
numérateur de l'expression précédente, prend valeur zéro. Il s'ensuit donc 
que, si Ho est vraie, la variable 


Z = ERP Pr Per est approximativement de loi M{(O, 1). 
fi, +éi, Pxdx PET 
nx ny 


On obtient donc un test de risque à en convenant de rejeter l'hypothèse H : 
Px= py Si [Z| > C,où C, est choisi tel que P(-c, <N(0,1<c,)=1-a. 


Reprenons l'exemple 3 où on l'avait laissé. Parmi les nx = 53 patients qui 
possèdent un animal familier, 3 sont décédés, ce qui donne px = 0,057. 
Parmi les ny = 39 patients qui ne possèdent pas d'animal familier, 11 sont 
décédés et on a p, = 0,282. On trouve donc que 


D, —p 0,057 - 0,282 
Deere EN = = -2,86. 
Pxdx | Pvdv 0,001 01+ 0,005 19 
nx ny 


Même en prenant à = 1 % (et c, = 2,576) on a |Z| > c,, ce qui conduit au 
rejet de Ho : px = pr. Le taux de mortalité est significativement plus faible 
chez les patients qui possèdent un animal familier. L'interprétation de cette 
conclusion ne relève plus des mathématiques... + 


Cas où les données sont appariées I1 arrive parfois que les données soient 
prélevées de telle sorte qu'on doive tester l'hypothèse Æ : px = py d'une autre 
façon. Ce sera le cas, par exemple, si les données sont appariées, 
c'est-à-dire, si c'est le même échantillon qui a servi à estimer chacune des 
deux proportions px et pr. 


Supposons qu'on veuille tester si la proportion px des foyers qui possèdent 
un four à micro-ondes est égale à la proportion py des foyers qui possèdent 
un magnétoscope. Lors d'un sondage portant sur 773 foyers, on a obtenu 
px= 502/773 = 0,649 et py = 478/773 = 0,618. Pour tester Ho : px = pr, il 
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serait incorrect d'utiliser le test précédent qui n'est valide que si les 
estimateurs px et py sont indépendants, ce qui n'est pas le cas ici, car c'est 
le même échantillon de foyers qui a servi à estimer px et py. Intuitivement, 
les familles « riches » ont beaucoup de chances de posséder les deux 
appareils alors que les familles « pauvres » ont beaucoup de chances de n'en 
posséder aucun. Pour un foyer tiré au hasard, les deux variables qualitatives 
« posséder un four à micro-ondes » et « posséder un magnétoscope » sont 
sans doute dépendantes. 


La probabilité px qu'un foyer possède un four à micro-ondes est la somme de 
deux composantes : 


px = P(posséder les deux appareils) + P(four et pas de magnétoscope). 
De même,ona 

py= P(posséder les deux appareils) + P(magnétoscope et pas de four). 
L'hypothèse nulle H : px = pr peut donc être reformulée d'une autre façon : 

H : P(four et pas de magnétoscope) = P[magnétoscope et pas de four). 


Pour tester Ho, nous ne considérons donc que le sous-échantillon formé des 
foyers qui possèdent un des appareils et ne possèdent pas l'autre et nous 
allons tester si, parmi ces foyers particuliers, la probabilité p qu'il soit du 
type « four et pas de magnétoscope » est égale à 1/2. L'hypothèse nulle Ho : 
px = pr est devenue Ho : p = 1/2 et l'échantillon a été réduit aux seuls foyers 
qui ne possèdent qu'un des deux appareils. 


Le tableau suivant indique la distribution conjointe des deux variables, pour 
les 773 foyers formant l'échantillon : 


Pas de four M.-O. Four M.-O. TOTAL 
Pas de magnétoscope 231 64 295 
Magnétoscope 40 438 478 
TOTAL 271 502 773 


Parmi les 773 foyers qui forment l'échantillon complet, on en trouve 
64 + 40 = 104 qui ne possèdent qu'un seul des deux appareils. Dans ce sous- 
échantillon de taille n = 104, une proportion p = 64/104 = 0,615 sont du type 
« four et pas de magnétoscope ». Pour tester l'hypothèse H : p = po = 1/2, il 
suffit de comparer Z = (P-Po)/JP54) avec le point critique c,, qui, si on 


prend à = 5 %, vaut 1,960. On obtient 
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Z = 104 (0,615 -0,5)/ = 2,35. 


Puisque |Z| > c,;, l'hypothèse nulle est rejetée et on conclut que plus de 
foyers possèdent un four à micro-ondes qu'un magnétoscope. Remarquons 
que si l'on avait (erronément) fait comme si px et py étaient indépendants, on 
aurait obtenu 


Z=(Bx-Py)/Jbxâx/nx +Bvâv/n, = 127 


et l'hypothèse nulle n'aurait pas été rejetée. 


9.3 TEST D'HYPOTHÈSE SUR UNE MOYENNE 


Considérons un échantillon X1, X2, .…. Xn, formé de variables (de loi non 
spécifiée) dont la moyenne théorique u et la variance théorique ©? sont 
inconnues. On veut tester l'hypothèse nulle 


Hj:H=u 


où Lo est un certain nombre donné. 


L'estimateur naturel pour u est à = X et, comme on a vu au chapitre 8, pour 
n suffisamment grand, 


est pratiquement de loi N{O, 1). 


1 = 
où 6° = ——Z©(X, - X)° est l'estimateur de o2. 
n-1 
Nous savons aussi que, si les observations X1, X2, … XA sont de loi normale, 
Xi Xi 


est exactement de loi t{, (Student, avec v=n- 1). 


Exemple 6 
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Même si les variables X1, X2, . Xh ne sont pas rigoureusement de loi 
normale, il est préférable d'utiliser quand même la loi de Student (plutôt que 
la loi normale) car elle conduit généralement à des résultats plus près des 
valeurs exactes. C'est ce que nous ferons dans toute la suite en traitant le 
cas d'un échantillon de loi non spécifiée comme s'il s'agissait d'un 
échantillon de loi normale et en laissant sous-entendu que si l'échantillon 
est vraiment de loi normale, les résultats seront exacts, même pour les 
petites valeurs de n. 


Si l'hypothèse Ho : 1 = lo est vraie, on peut donc considérer que, si n est 
assez grand, la variable 


est pratiquement de loi t, (Student, avec v=n-1). 


L'hypothèse nulle sera rejetée si T est trop grand ou trop petit, c'est-à-dire si 
Test hors de l'intervalle (-c,, c,) où c, est tel que P(-c, < tn < ©) = 1 - ©. 


Hs est rejetée si | T| > ©. 
Ho est acceptée si | T| < c. 


Cette procédure peut aussi être présentée sous la forme : 


= c 6 
H, est rejetée si [X-u, |} —— ; 
Vn 
rer C,S 
H, est acceptée si | X-u, |[< 
n 


Des expériences passées ont permis de déterminer que le temps moyen de 
sommeil des gens est de 7,7 heures. Une compagnie pharmaceutique, 
voulant tester la valeur d'un nouveau somnifère, a effectué des expériences. 
Un échantillon de taille 10, où le somnifère a été utilisé, a donné les 
résutats : 


7,8 8,3 7,2 9,1 8,4 6,8 7,3 7,7 8,9 9,2 


Tester, avec à = 5 %, l'hypothèse selon laquelle le nouveau somnifère n'a 
aucun effet sur la durée moyenne du sommeil, c'est-à-dire Ho : u = lo = 7,7. 
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Solution : n = 10, EX; = 80,7 et EX? = 657,61, ce qui donne X= 8,07 et 


6 = 0,840 7. De ces valeurs on obtient 


n(X- 10 (8,07 -7,7 
a Le DU ss 


(o] 0,840 7 
Puisque v=n-1=9eta=5%, on obtient, de la table de la loi de Student, 
Cy = 2,262. 


Puisque |T| < c,, l'hypothèse nulle n'est pas rejetée. Rien ne prouve que le 
somnifère modifie la durée du sommeil. + 


9.4 


Exemple 7 


TEST SUR L'ÉGALITÉ DE DEUX MOYENNES 


Un des problèmes statistiques les plus fréquemment rencontrés est celui de 
pouvoir tester l'hypothèse selon laquelle, pour deux populations différentes, 
une certaine variable prend, en moyenne, la même valeur. On dispose de 
deux échantillons, X1, X2, .…, Xnx, et Y1, Y2, …, Yny, provenant de chacune des 
deux populations, et l'hypothèse nulle qu'on veut tester est Ho : ux = y. 


On veut savoir si deux espèces de poules, l'espèce A et l'espèce B, pondent 
des œufs de même calibre. Le poids moyen de 50 œufs provenant de poules 
de l'espèce À, est de 52,4 grammes, celui de 80 œufs provenant de l'espèce B 
est de 54,3 grammes. L'écart de 1,9 grammes observé entre ces deux 
moyennes est-il suffisamment grand pour qu'on puisse rejeter l'hypothèse 
selon laquelle les poids moyens théoriques ux et uv sont égaux ? Tel que posé, 
ce problème n'a pas de solution car il y manque une information cruciale : la 
dispersion des observations. L'écart de 1,9 observé entre Xet Ÿ sera jugé 
grand (ou petit) selon que, dans les échantillons, les observations sont 
fortement concentrées (ou largement dispersées). Nous y reviendrons plus 
loin, après avoir développé les formules pertinentes. + 


Considérons deux échantillons indépendants X1, Xo, .…., Xnx, et Vi, Yo, …., Yny, 
de lois non spécifiées, et pour lesquelles les moyennes et les variances 
théoriques Lx, Ly, © : et oŸ sont inconnues. On veut tester l'hypothèse nulle 


oHx = Hy: 


On sait que si les tailles net n, des échantillons sont grandes, les moyennes 
expérimentales X et Ÿ sont approximativement de lois N(u ES / n). 6 


N(u,,6% /n, ), respectivement. X et Ÿ étant indépendants, on obtient que 
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2 2 
= G G 
X -Y est approximativement de loi “us —hy pre 
nx ny 


d'où il vient que 


est approximativement de loi M(O, 1). 


Si l'hypothèse H,:u, =, est vraie, le terme (un, =u,) qui paraît au 


numérateur de l'expression précédente disparaît et on obtient que 


XV 
est approximativement de loi N(0, 1). 


2 


2 . . 
,X et oy qui paraissent au 


Si net n, sont grands, les variances inconnues 6 
dénominateur peuvent être remplacées par leurs valeurs estimées à 0 et 


6 . On obtient donc que, si Hi est vraie, 


X-Y 
Z=——— est approximativement de loi MN(O, 1). 


22 
Sy 
n 


X Y 


L'hypothèse nulle sera rejetée si Z prend une valeur trop grande ou trop 
petite, c'est-à-dire, si Z est hors de l'intervalle (-c,,c.) où c,, est tel que 
P(-cx < M0, 1) < c) = 1-0. 


Ho est rejetée si | Z| > cu. 


H, est acceptée si [Z| < c.. 


Cette procédure peut aussi être présentée sous la forme 
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Exemple 8 


22 #2 
NASA Tue Sx Sy 
Hb est rejetée si |X-Y >c, | ——+— ; 
nx ny 
n 2 22 
2 LL. D x Cy 
Hb est acceptée si|[X-Y [<c, |——+—. 
nx ny 


Reprenons l'exemple 7 dans lequel on voulait savoir si deux espèces de 
poules pondaient des œufs de poids moyen identiques. Avec nx 50 et ny = 80, 
on avait obtenu X = 52,4et ŸY = 54,3. 


a) À quelle conclusion arrive-t-on si 6, = 2,7 et 6, = 4,5 ? (prendre 
a = 5 %). 

b) À quelle conclusion arrive-t-on si 6, = 10,6 et 6, = 7,4 ? (prendre 
a = 5 %). 


Solution : Avec à = 5 %, on prend c, = 1,960. L'hypothèse nulle est 
H,:hx=u,. 


a) On trouve 


Z= œ-7)/Je2 In, +82/n, = _1,9/,/0,145 8+0,253 1 = -3,01. 


Puisque |Z| > c,, l'hypothèse nulle est rejetée. Les poules de l'espèce B 
pondent des œufs significativement plus lourds que celles de l'espèce A. 


b) On trouve maintenant Z - —1,9//2,247 2+0,684 5 = -1,11. Puisque |Z]| < c,, 


l'hypothèse nulle est acceptée. La différence entre X et Ÿ est aisément 
expliquée par le hasard. + 


Cas où les variances sont supposées égales I1 arrive fréquemment qu'il soit 


2 


naturel de supposer que les variances inconnues che et o, 


sont égales. Ce 


sera le cas, par exemple, si l'on veut tester l'efficacité d'un engrais agricole, 
d'un médicament, d'un traitement particulier. On peut alors supposer que 
l'engrais ou le médicament n'agit que sur la moyenne de la variable mesurée, 
ne fait que déplacer la courbe des données sans en affecter la dispersion. 
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Quand les variances 6% et © ‘ sont égales, on n'a plus à les distinguer ; 
chacune est égale au même 6°. Alors, X-Y est approximativement de loi 


2 : x 
nlus y, Gr). Si H,:u, =u,est vraie, 


XV 
est approximativement de loi M(O, 1). 
1 1 
G | — + — 
nx ny 


La variance commune 6° peut être estimée au moyen d'une moyenne 


pondérée des deux estimateurs 6% et 6°. On pose 


.) (Mx-D6%+(n, -162 
2 = 


ny, +n, -2 
_ EX, -X)? +507, -Y}? 


ny +ny —2 


2 V2 2 \7 2 
_ EX; —n,XT +EYS -n,Y 


ny +n, —-2 


On peut montrer que cet estimateur est sans biais pour 6°. On peut aussi 


montrer que si les observations X; et Y; sont de loi normale (et si Ho est vraie), 


X=Y | 
est exactement de loi t,. 


ou 
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Exemple 9 


D'autres formes équivalentes pour T sont : 


ae n,n; 
(e) n, +n, 


L'hypothèse nulle sera rejetée si T prend une valeur trop grande ou trop 
petite, c'est-à-dire, si Test hors de l'intervalle (-c,,c) où cest tel que 


P(-c, NT <c, =1-a. 

Si les observations sont de loi normale, le c,; obtenu de la table de la loi de 
Student (avec v = nx + ny - 2) conduit à un test rigoureusement exact. Si les 
observations ne sont pas de loi normale, on préfère prendre quand même le 


c, dans la table de la loi de Student plutôt que dans celle de la loi normale. 


Un jardinier amateur veut savoir si l'engrais qu'il utilise pour ses plants de 
tomates est vraiment efficace. Pour ce faire, il a privé d'engrais 2 de ses 
plants de tomates, choisis au hasard en début de saison, et n'a donné de 
l'engrais qu'aux 6 autres plants. Au moment de la cueillette, il a pesé la 
production de chaque plant. 


Les plants sans engrais ont fourni respectivement 12,3 et 13,6 kg de 
tomates. Pour les plants traités à l'engrais, les résultats, en kilogrammes, 
ont été : 14,1, 12,8, 15,1, 13,7, 13,4 et 15,4. 


En supposant que l'engrais n'agit que sur 1 sans affecter o, tester, avec 


a = 10 %, l'hypothèse selon laquelle l'engrais n'a aucun effet. 


Solution : Notant par X les productions des plants sans engrais et par Y 
celles des plants traités à l'engrais, on trouve : 


n, =2,X=12,95,6% =0,845,n, =6,Y =14,08,67 = 1,006 


d'où on obtient que 6? = 0,979 et T=-1,40. 


Avec à = 10 % et v = nx + ny —- 2 = 6, la table de la loi de Student donne 
Ca = 1,943. 


Enfin, puisque |T| < c,, l'hypothèse H, :u, =u, ne peut être rejetée. L'écart 


observé entre X et Ÿ n'est pas significatif. + 
Remarque Quand les variables sont normales, l'emploi de la loi de Student 


pour la détermination de c, permet d'obtenir un test exact (c'est-à-dire : dont le 
risque réel est exactement le risque à désiré) seulement dans le cas où les 
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variances inconnues sont supposées égales. Si lon ne fait pas cette 
supposition, l'obtention d'un test exact est beaucoup plus difficile et on doit se 
contenter d'appliquer le test approximatif développé au début de la présente 
section. Soulignons que, pour plus de sécurité, on préfère parfois ne pas 
utiliser la loi normale mais tirer plutôt le c, de la loi de Student où le nombre 
de degrés de liberté sera le plus petit des deux nombres nx- 1 et ny - 1. 


Cas où les données sont appariées 11 est souvent avantageux — par exemple, 
quand on veut savoir si un certain traitement a un effet réel ou non - 
d'utiliser les mêmes unités statistiques (les mêmes individus) pour mesurer 
sur chacun à la fois X et Y, la valeur avec traitement et la valeur sans 
traitement. 


Les deux échantillons sont alors nécessairement de même taille (nx = ñny = n) 
et l'hypothèse selon laquelle le traitement est sans effet est Ho : ux = ny. 


Dans un tel contexte expérimental, chacun des échantillons Xi, X2, ..…., Xn, et 
Yi, Y2, .…, Yn, est bien formé de variables indépendantes entre elles mais, 
d'un échantillon à l'autre, la condition d'indépendance n'est plus satisfaite. 
La mesure Xi et la mesure Yi provenant toutes deux du même individu, tout 
porte à croire qu'elles seront vraisemblablement liées l'une à l'autre. Pour 
tester Ho : ux = y, il est donc hors de question d'utiliser les tests qui 
viennent d'être développés, qui ne sont valides que si les deux échantillons 
sont indépendants l'un de l'autre. Quand les données sont appariées, le test 
qu'il convient d'appliquer est, en fait, plus simple que celui qui suppose 
l'indépendance : il suffit de calculer, pour chaque individu, l'effet du 
traitement 


Wi= Xi- Yi 


L'hypothèse nulle H : ux = uy devient alors 


Ho : uw =0 
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Exemple 10 


et le test sur l'égalité de deux moyennes est remplacé par un test 
paramétrique portant sur une seule moyenne, celle de W. Pour tester 
Ho : uw = 0, il suffit donc d'appliquer les techniques développées à la section 
9.3, c'est-à-dire, calculer 


Wu  vnW 


Sy /Vn Sw 


T 


où 6 = (CW} -nW?)/(n-1, puis 


rejeter Ho si |T| > & 


ou accepter Ho si [T| <c 


où c, est tel que P(-c < tn1 < Ci) = 1 — &. 


Dix individus ont été pesés avant et après avoir cessé de fumer durant une 
période d'un mois. Les données recueillies sont celles du tableau suivant : 


i 1 2 3 4 5 6 7 8 9 10 


Poids avant (Y kg) 78 70 90 81 55 68 76 60 73 74 


Poids après (X kg) 78 69 92 83 55 72 74 63 74 76 


Tester, avec à = 10 %, l'hypothèse selon laquelle le fait de cesser de fumer 
n'a aucun effet sur le poids. 


Solution Les gains de poids Wi= Xi- Yi, pour chacun des 10 individus, sont 
O —1 2 2 (0) 4 —2 3 1 2 

On trouve 2W,=11,2W? =43,W =11,67%, =3,433,6, =1,853, ce qui donne 
T=VnW/é, =1,877. 

Avecv=n-1=9eta= 10 %, la table de la loi de Student donne c, = 1,833. 
Puisque |T| > c,, l'hypothèse nulle est rejetée (de justesse !). Le fait de cesser 
de fumer semble avoir un effet réel sur le poids. Remarquons que si l'on 
avait (erronément) traité les deux échantillons initiaux comme s'ils étaient 
indépendants, on aurait grossièrement surestimé la variance de W=X-Yen 
calculant 6% /n, +62 /n, =(103,82/10)+(101,39/10) = 20,521, valeur près de 6 


fois trop grande et qui aurait conduit à une acceptation fautive de Ho. 


9 Tests d'hypothèses 293 


9.5 


TEST D'HYPOTHÈSE SUR UN PARAMÈTRE 6 QUELCONQUE 


Ici encore, les concepts déjà développés dans le chapitre 8 dans un contexte 
d'estimation se transposent directement dans le présent contexte de test 
d'hypothèse. 


On dispose d'un échantillon X1, X2, .…, Xn, de loi spécifiée (Poisson, géo- 
métrique, etc. ; on a déjà traité le cas binomial) dont la distribution précise 
dépend d'un certain paramètre que nous notons 6. Dans le cas binomial, 0 
tient lieu de p ; dans le cas d'une loi de Poisson, 6 représente À. On suppose 
que seul 8 est inconnu et on veut tester 


Hs : 6 = 60 où 60 est un nombre donné. 


On dispose d'un estimateur convenable 6 dont on sait exprimer la variance 
5é en fonction de 6 (et de n). On suppose aussi, que, pour n grand, 6 est 


approximativement de loi N(6,6€) ; cette supposition est habituellement 


satisfaite si 6 est défini en fonction, par exemple, de la somme des Xi On a 
alors que 


0 -0 


est approximativement de loi M{(O, 1). 


G 
8 


Si l'hypothèse nulle est vraie, 6 = 00 et on a que 


est approximativement de loi N{O, 1), 


où 5: est connue puisqu'on sait exprimer © : en fonction de 6 et qu'on 


connaît la valeur de 6, égale à 6, (si l'hypothèse nulle est vraie). 
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Exemple 11 


Il ne reste plus qu'à 


rejeter Ho si |[Z| > & 


ou accepter Ho si [ZI <c 


où c., est tel que P(-c, < M0, 1) < c,) = 1-0. 


C'est précisément ce qui a été fait dans le cas du paramètre p de la loi 
binomiale et qu'on peut faire maintenant pour plusieurs autres lois. 


Dans une certaine ville, il se produit, en moyenne 2,3 vols par effraction par 
jour. Depuis 50 jours une campagne d'information sur les moyens de 
prévention est en cours, Durant cette période, il s'est produit 91 vols. 
Peut-on conclure que la campagne a eu un effet réel ? 


Solution : Le nombre X d'événements (vols) qui se produisent durant une 
certaine période de temps devrait suivre une loi de Poisson. Si l'on note par X\, 
X2, …. Xn les nombres de vols qui ont eu lieu chaque jour, chacun de ces X: 
devrait suivre une loi Poisson(i) où, si l'hypothèse nulle est vraie, À = Ào = 2,3. 


L'estimateur naturel de À est À=X et 5° 6 /n =)/n. Si H est vraie, 


jen —. 
Z= devrait être de loi MO, 1). 


k/n 


Il ne reste plus qu'à voir si |Z| > c,, puis décider, selon le cas, de rejeter ou 
d'accepter l'hypothèse nulle. 

Dans notre exemple, n = 50, Ào = 2,3 et ZXi = 91, ce qui donne À = X = 91/50 = 
1,82 et Z - (1,82 -2,3)/ /2,3/50 =-2,24. Avec à = 5 %, on a © = 1,96 et 
l'hypothèse nulle est rejetée. La campagne d'information a un effet réel. + 


Test sur l'égalité de 0, et 0, Encore une fois, la loi est spécifiée et on compare 


deux populations pour savoir si, chez chacune, le paramètre 6 a la même 
valeur. On dispose de deux échantillons indépendants X1,, X2, .…, Xn et Yi, 


Y2, …, Yn, qui fournissent les estimateurs 6, et ‘ee On suppose que ces 


deux estimateurs sont approximativement de lois 


2 2 
No x.02. ) et No,.52 ) 
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et que, par conséquent, 


Bx -6, — (8% —0,) 


est approximativement de loi N{O, 1). 


est approximativement de loi N{O, 1), 


où 6 : est l'estimateur de 6 : obtenu en remplaçant 6: par ) X dans la 
X X 


formule qui exprime Var(o X) en fonction de 8-et de nx (et © : est obtenu de 
Y 
façon analogue). 


Si l'hypothèse nulle Ho : 0x = 0y est vraie, le terme 0x -— 0y disparaît et on 
obtient que 


est approximativement de loi MO, 1). 


Il ne reste qu'à 


rejeter Ho si |[Z| > 


ou accepter Ho si [Z| < 
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Exemple 12 On suppose que la durée de vie (en heures) d'une certaine pièce de 
machinerie se distribue selon une loi exponentielle, que 10 pièces de marque 
À, mises à l'épreuve, ont duré, en moyenne, 8,4 heures et que 15 pièces de 
marque B ont duré, en moyenne, 12,3 heures. L'hypothèse selon laquelle les 
deux marques sont de même qualité doit-elle être rejetée ? Prendre à = 5 %. 
Solution : On sait que l'espérance et la variance d'une variable de loi Exp(0) 
sont, respectivement, 8 et 0 2. L'estimateur 0 = X est donc sans biais pour 
6+ et sa variance, 

2 Var) _ 0x 
L* n> nx 
est estimée par 
FRS 
G = = —— 
x nx nx 
On fait de même pour 6, =Ÿ et on obtient que, si Ho : 0x = Ov est vraie, 
X-Y _…— 
Z =——— est approximativement de loi M0, 1). 
XF (Ve 
= — + + 
nx ny 
Ici, nx= 10, X = 8,4, ny 15et Y = 12,3. On obtient donc que 
Z-(8,4-12,3)/ J70,56/10 +151,29/15 = -0,04. 
Cette valeur étant à l'intérieur de l'intervalle (-c,,c;) où © = 1,960, 
l'hypothèse nulle ne peut être rejetée. Les résultats expérimentaux ne 
permettent pas d'affirmer qu'une marque est meilleure que l'autre. 
RÉSUMÉ 


Test d'hypothèse L'hypothèse nulle est rejetée si les résultats 
expérimentaux s'écartent trop de ce que le hasard devrait permettre. Le 
risque a est la probabilité de rejeter Ho quand elle est vraie. 
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Loi de la Hypothèse Variable utilisée Condition de Source du c, 
population Ho rejet de Ho 
Vn (BP) 

Binomiale P = Po PS ——— IZI>c, Loi N(0, 1) 

V Podo 
Normale : T Vn(X- Lo) IT > c Loi de Student 
(ou non spécifiée) Fe E = ° avecv=n-1 

$ -0 

0 
Quelconque 0=00 Z= IZI>c, Loi N(0, 1) 
(o] 


1 = Ne 
* G?= EX, -X) = {x -X?). 
n-1 


n-1 


55 5£ est obtenu en remplaçant 6 par 60 dans la formule qui donne Var( ). 


Test sur l'égalité de deux paramètres 


Loi de la Hypothèse Variable Condition de Source du 
population Ho utilisée rejet de Ho Ca 
7= px — P, 
Binomiale px = py De. Pyde IZ1>c, Loi N(O, 1) 
RER PR A + rs) 
nx ny 
Normale Y_VY : 
Net nxny Loi de Student 
(ou non spécifiée) Lx = Ly T = ITl>c, ee 
ee ) nx+n, avec v=n - 
Loi N(0, 1) ou loi 
Normale L |Z|>c de Student où v est 
(ou non spécifiée) RATE à le plus petit de 
nx-1etny-1 
Z= 8 X —0 Y 
Loi quelconque 0x = 07 Ur ; FA Loi N(0, 1) 
GO: +6 
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 (nx-D6%+(n, -162 
GO — . 


nx+n, — 2 


* 


ne de est obtenu en remplaçant 6, par 6 X dans la formule qui donne 
Var(o , ) ; de même pour Y. 


Cas où les données sont appariées. Ho : px = py. On ne considère que le 
sous-échantillon pour lequel les deux variables prennent des valeurs 
différentes l'une de l'autre. L'hypothèse nulle se réduit alors à Ho : p = 1/2 
où p est la proportion de cas (0, 1) parmi l'ensemble des cas (0, 1) et (1, O) 


retenus dans le sous-échantillon. 


Ho : x = ur. On pose Wi = Xi- Yi et l'hypothèse nulle se réduit à Ho : uw = O. 


EXERCICES 


TEST 
D'HYPOTHESE SUR 


UNE PROPORTION 


1. Un politicologue prétend que, lors des élections, 95 % des époux votent 
pour le même parti que leur femme. Un sondage effectué auprès de 540 
couples a révélé que dans 42 cas, l'époux et l'épouse n'avaient pas voté 
pour le même parti. Testez, avec à = 5 %, l'hypothèse émise par le 
politicologue. 


2. Deux joueurs de ping-pong, André et Bernard, ont joué 30 parties. André 
en a gagné 18 et Bernard en a gagné 12. Testez, avec à = 10 %, 
l'hypothèse selon laquelle André et Bernard sont de même force au 
ping-pong. 

*3. On veut tester l'hypothèse qu'un sou est bien équilibré (c'est-à-dire, que 
la probabilité d'avoir « face » est égale à celle d'avoir « pile »]. On prend 
a = 10 %. 


a) Si, en réalité, la probabilité d'avoir « face » est 0,52 et si on lance le 
sou 1 000 fois, quelle est la probabilité que l'hypothèse nulle soit 
rejetée ? 


b) Si la probabilité d'avoir « face » est 0,52, combien de fois le sou doit-il 
être lancé pour que la probabilité que l'hypothèse nulle soit rejetée 
soit de 0,90 ? 


TEST SUR 
L'ÉGALITÉ DE 
DEUX 
PROPORTIONS 
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Une étude des décisions rendues par des jurés dans des cas de vols par 
effraction où l'accusé était de race noire a révélé les faits suivants : parmi 
les 28 cas où les victimes étaient de race noire, l'accusé a été trouvé 
coupable dans 12 cas ; parmi les 36 cas où les victimes étaient de race 
blanche, l'accusé a été trouvé coupable dans 23 cas. Peut-on conclure que 
les jurés ont une plus forte tendance à déclarer coupables ceux qui sont 
accusés d'avoir commis des vols contre des Blancs? (Utilisez & = 10 %). 


Dans une classe, 98 étudiants sont nés au Canada et 47 ailleurs. On 
constate que 20 des étudiants nés au Canada et 7 de ceux qui sont nés 
ailleurs portent des lunettes. La différence entre les deux groupes est-elle 
significative ? (Utilisez à = 0,05). 


Pour comparer deux procédés de fabrication, on prélève un échantillon 
de 300 pièces produites par le procédé À et 400 pièces produites par le 
procédé B. On trouve que 10 pièces du procédé A et 15 pièces du procédé 
B sont défectueuses. La différence entre les deux procédés est-elle 
significative ? 


Pour évaluer l'efficacité d'un somnifère, on fait l'expérience suivante avec 
100 sujets. On répartit les sujets au hasard en deux groupes égaux. Le 
premier groupe, appelé « groupe expérimental », reçoit le somnifère un soir 
au coucher. Le deuxième groupe, appelé « groupe témoin », reçoit un 
placebo. Le lendemain on pose la question suivante : « Avez-vous mieux 
dormi que d'habitude ? » Dans le groupe expérimental, 30 personnes disent 
oui, alors que dans le groupe témoin seulement 25 personnes disent oui. 
Peut-on affirmer que le somnifère a un effet ? (Utilisez & = 0,20). 


Dans le cadre d'une étude portant sur la sécurité routière et la visibilité 
nocturne des couleurs, on a conçu une expérience dans laquelle deux 
objets de même dimension, l'un rouge et l'autre jaune, étaient présentés 
à des gens qui devaient déclarer s'ils parvenaient ou non à les percevoir. 
218 personnes ont participé à l'expérience ; 138 d'entre elles ont vu les 
deux objets, 25 n'ont vu que l'objet jaune, 11 n'ont vu que l'objet rouge, 
et les 44 autres personnes n'ont vu aucun des deux objets. Testez 
l'hypothèse selon laquelle la probabilité de perception est la même pour 
les deux couleurs. (Utilisez & = 5 %). 
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TEST 
D'HYPOTHESE SUR 


UNE MOYENNE 


TEST SUR 
L'ÉGALITÉ DE 


DEUX MOYENNES 


10. 


Une revue prétend que ses lecteurs ont un revenu annuel moyen de 
45 000 $ Pour vérifier cette affirmation, on prélève un échantillon de 
20 lecteurs et on note leurs revenus annuels. Voici les données, en 
milliers de dollars. 


42,1 43,5 41,8 47,2 46,1 
39,2 32,3 28,2 49,1 52,2 
61,5 31,2 34,3 21,1 31,5 
46,2 48,9 31,2 22,7 28,2 


Est-il vraisemblable que le revenu moyen des lecteurs soit de 45 000 $ ? 
(Utilisez à = 0,05). 


Pour tester l'hypothèse que la moyenne LH d'une population est égale à 
95, on prélève un échantillon de taille 9. 


a) Testez l'hypothèse que 1 = 95 si les données sont 

94 95 96 98 100 102 104 105 106 
b) Testez l'hypothèse que M = 95 si les données sont : 

60 70 80 90 100 110 120 130 140 


c) Remarquez que la moyenne X est égale à 100 pour les deux 
échantillons. Donc, en un sens les deux échantillons sont aussi 
éloignés l'un que l'autre de la moyenne de 95 stipulée par l'hypothèse 
nulle. Donnez la raison intuitive pour laquelle on rejette l'hypothèse 
dans un cas et pas dans l'autre. 


Un analyste au service du personnel d'une compagnie se demande quels 
sont les traits de personnalité qui font qu'un vendeur est un bon 
vendeur. En particulier, il veut savoir si le fait d'être extraverti est un 
atout. Il choisit 20 vendeurs connus dans la compagnie comme 
excellents ; et 32 vendeurs plutôt médiocres. Il leur fait passer un test 
d'extraversion. Voici les scores qu'il a obtenus (les extravertis ont des 
scores élevés) : 


Bons vendeurs : 12, 17, 20, 19, 11, 9, 7, 4, 12, 15, 13, 18, 20, 16, 15, 
16, 18, 13, 11, 10. 


Vendeurs médiocres : 12, 7, 9, 13, 15, 17, 12, 11, 13, 10, 9, 8, 7, 15, 13, 
6, 5, 5, 13, 15, 17, 19, 18, 20, 19, 17, 13, 16, 8, 6, 7, 8. 


12. 


15. 


14. 


15. 
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Testez au niveau à = 5 % l'hypothèse que les bons vendeurs ne sont ni 
plus ni moins extravertis que les vendeurs médiocres. 


Lors d'une étude sur le « concept de soi » des adolescents nigérians, 
Jegede (1982) a administré le Piers-Harris Self-Concept Scale à 1 380 
élèves de niveau secondaire à Ibadan. 


a) Le score moyen a été 58,19 avec un écart-type de 10,06. Dans une 
étude antérieure faite auprès de 1 183 adolescents américains on 
avait trouvé une moyenne de 51,84 avec un écart-type de 13,87. La 
différence entre les Américains et les Nigérians est-elle significative ? 


b) L'échantillon de Jegede était composé de 552 filles et 828 garçons. 
Les filles avaient une moyenne de 56,82 avec un écart-type de 9,96 ; 
et les garçons une moyenne de 59,11 avec un écart-type de 10,01. La 
différence entre les garçons et les filles est-elle significative ? 


Peterson (1976) a relevé les résultats au test ACT (American College 
Testing Program) d'un groupe de 305 étudiants de classes défavorisées et 
de 2 182 étudiants de classes favorisées. Parmi les défavorisés, la 
moyenne était de 1,68 avec un écart-type de 1,088 alors que parmi les 
favorisés la moyenne était de 2,07 avec un écart-type de 1,015. La 
différence entre les deux groupes est-elle significative ? 


Les données suivantes” portent sur des diplômés d'université de 
1974-1975, interrogés en 1978. On leur a demandé, entre autres, quelle 
était la durée de leur dernière période de chômage. Parmi les 3 445 
diplômés anglophones la durée moyenne était de 14,2 semaines avec un 
écart-type de 13,3, alors que parmi les 12 571 diplômés francophones la 
durée moyenne était de 18,5 semaines avec un écart-type de 15,3. La 
différence entre francophones et anglophones est-elle significative? 


On émet l'hypothèse que, dans un couple, l'époux est en moyenne plus 
âgé de deux ans que son épouse. Un sondage effectué auprès de 100 
couples a donné une différence moyenne de 2,68 ans avec un écart-type 
de 3,8 ans. L'hypothèse nulle est-elle rejetée par le test avec à = 10 %, 
avec à = 5  ? 


* Service général des communications, Relance à l'université, Direction politique et plans, MEQ 1979. 
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TEST 
D'HYPOTHÈSE SUR 
UN PARAMÈTRE 6 
QUELCONQUE 


16. 


17. 


18. 


19. 


20. 


Introduction à la statistique appliquée 


Une nouvelle convention collective prévoit, pour la première fois, des 
congés de maladie remboursables. On s'attend à ce que cela réduise le 
taux d'absentéisme. Pour voir si c'est bien vrai, on prélève des données 
sur le taux d'absentéisme (nombre d'absents par jour par 1 000 
employés) dans les 11 usines de la compagnie pendant deux périodes de 
6 mois, l'une avant et l'autre après l'entrée en vigueur de la nouvelle 
convention. Voici les données : 


Usine 1 2 3 4 5 6 7 8 9 10 11 
Avant 25 28 29 26 28 27 22 25 27 28 29 
Après 21 23 22 21 26 29 21 22 23 22 25 


Testez à 5 % l'hypothèse selon laquelle la nouvelle convention collective 
n'a pas eu d'effet sur le taux d'absentéisme. 


Pour connaître l'efficacité d'un certain régime amaïigrissant, on le fait 
suivre à 6 sujets. On prend leurs poids avant et après le régime. Voici les 
résultats : 


Sujet 1 2 3 4 5 6 
Avant 64 54 73 59 64 68 
Après 61 54 71 58 61 66 


Le régime a-t-il un effet ? Fixez à = 5 %. 


On suppose que la durée de vie d'une certaine pièce de machinerie suit 
une loi exponentielle. Le fabricant des pièces prétend qu'elles durent en 
moyenne 10 heures. Ayant mis 12 pièces à l'épreuve, on a observé que 
ces pièces ont duré, en moyenne, 7,4 heures. Testez, avec à = 10 %, 
l'hypothèse selon laquelle le fabricant n'a pas menti. 


Une compagnie d'assurances reçoit, en moyenne, 30,6 réclamations par 
semaine. 


a) La semaine dernière la compagnie a reçu 38 réclamations. Cette 
observation s'écarte-t-elle significativement de la moyenne générale ? 
b) Le mois dernier (4 semaines) la compagnie a reçu 148 réclamations, 


ce qui donne une moyenne de 37 réclamations par semaine. Cette 
observation s'écarte-t-elle significativement de la moyenne générale ? 


Durant une certaine période de temps, 35 crimes ont été commis dans la 
ville À et 21 dans la ville B. Sachant que les populations de ces villes 
sont 58 000 pour A et 22 000 pour B, testez l'hypothèse selon laquelle le 
taux de criminalité (par 1 000 habitants) est le même pour ces deux 
villes. Prenez à = 5 %. 


DIVERS 


21. 


22. 


23. 


24. 


25. 


26. 
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Supposons qu'en général, la probabilité d'avoir un garçon est de 0,515. 
On prélève un échantillon de 125 naissances parmi les membres d'une 
secte religieuse dont les mœurs sexuelles seraient susceptibles 
d'influencer le sexe du bébé. On trouve que 68 des 125 nouveaux-nés 
sont des garçons. Peut-on conclure que la probabilité d'avoir un garçon 
chez les gens de cette secte est différente de 0,515 ? 


Supposons que le revenu moyen des familles canadiennes est de 
30 000 $. On prélève un échantillon de 250 familles dont le chef est une 
femme. On trouve que leur revenu moyen est de 17 610 $ avec un 
écart-type de 8 540 $. Peut-on conclure que les familles dont le chef est 
une femme ont un revenu moyen inférieur à celui de l'ensemble des 
familles canadiennes ? 


Supposons que le revenu médian des familles canadiennes est de 
28 890 $. On prélève un échantillon de 250 familles dont le chef est une 
femme. On trouve que 24 d'entre elles ont un revenu supérieur à 
28 890 $. Testez l'hypothèse selon laquelle le revenu médian des familles 
dont le chef est une femme est égal à 28 890 $. 


La fabrication d'un certain article coûte 20 € la pièce et 10 % de ces 
pièces sont défectueuses. On essaye un nouveau procédé de fabrication 
qui coûte 21 © la pièce mais qui pourrait avoir un taux de défectuosité 
plus faible. Sur 500 pièces fabriquées par le nouveau procédé, on trouve 
13 pièces défectueuses. Testez l'hypothèse selon laquelle le nouveau 
procédé n'est ni plus avantageux ni moins avantageux que l'ancien. 


Deux archers, Xavier et Yvon, s'exercent au tir à l'arc. En 100 lancers, 
Xavier a atteint la cible 58 fois. Yvon, lui, a atteint la cible 99 fois en 150 
tirs. Avec à = 10 %, doit-on rejeter l'hypothèse selon laquelle les deux 
archers sont de même force ? 


On veut savoir si, dans deux quartiers différents d'une ville, les 
logements ont en moyenne le même nombre de pièces habitables. Dans 
le quartier A, 80 logements choisis au hasard ont donné X = 4,32 et 
6, = 1,07. Dans le quartier B, un échantillon de 50 logements a donné 


Y =3,92 et 6, = 0,95. Avec à = 5 %, testez l'hypothèse Ho : 1x = pr. 
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*27.Considérons l'ensemble des maisons de Montréal habitées par leur 
propriétaire ; et supposons que, pour les fins d'une enquête, on divise cet 
ensemble en blocs de 10 maisons chacun. On prélève au hasard un 
échantillon de 100 blocs, on interroge tous les propriétaires choisis, et on 
note pour chaque bloc la valeur de la variable 


X : nombre de propriétaires qui emploient les services d'un jardinier. 


On obtient la distribution suivante : 


X 0 1 2 3 4 5 6 7 8 TOTAL 
Effectif 25 10 12 9 8 16 10 7 3 100 


Nous voulons tester l'hypothèse selon laquelle 34,5 % des propriétaires 

utilisent les services d'un jardinier. Une autre formulation de cette même 

hypothèse est la suivante : le nombre moyen de propriétaires, dans un 

bloc, qui utilisent les services d'un jardinier est de 3,45. Testez cette 

hypothèse à 5 % : 

a) En considérant qu'on a prélevé un échantillon de 1 000 maisons 
dans une population de maisons. 

b) En considérant qu'on a prélevé un échantillon de 100 blocs dans une 
population de blocs. 


*28.Une usine fabrique des vis qu'elle met dans des boîtes de 100. Soit X le 
nombre de vis défectueuses dans une boîte. Supposons qu'une longue 
expérience du procédé de fabrication a permis de dresser la fonction de 
masse suivante : 


X 0 1 2 3 4 5 6 TOTAL 
p 0,13 0,27 0,27 0,18 0,09 0,04 0,02 1,00 


Un nouveau procédé est considéré, et pour le tester on l'emploie à la 
fabrication de 100 boîtes de vis. On obtient la distribution suivante : 


X 0 1 2 3 4 5 6 TOTAL 
Effectif 30 21 13 15 12 5 4 100 


Le patron de l'usine demande à trois statisticiens de tester l'hypothèse 
nulle selon laquelle « le nouveau procédé est pareil à l'ancien ». Le 
statisticien A fait un test du khi-deux. Le statisticien B fait un test basé 
sur la proportion p de vis défectueuses parmi les 10 000 de l'échantillon. 


Le statisticien C, enfin, fait un test basé sur le nombre moyen X de vis 
défectueuses par boîte. 


Effectuez les trois tests et commentez. 


29. 


30. 
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Dans une étude sur la relation entre certains traits de personnalité et 
des facteurs astrologiques, Sakofske, Kelly et McKerracher (1982) ont fait 
compléter le Eysenck Personality Questionnaire à 241 étudiants 
néo-zélandais. L'hypothèse, avancée antérieurement par des astrologues, 
que ces chercheurs se proposaient de vérifier est que les personnes nées 
sous un signe positif (Bélier, Balance, Gémeaux, Lion, Verseau, 

Sagittaire) sont moins introverties que les personnes nées sous un signe 

négatif (Cancer, Capricorne, Poisson, Scorpion, Taureau, Vierge). Sur 

l'échelle introversion-extraversion du test, les extravertis ont un score 
élevé. 

a) Parmi les sujets, 117 étaient nés sous un signe positif ; ceux-ci ont 
obtenu un score moyen de 13,28 avec un écart-type de 4,51. Les 
autres 124 sujets étaient nés sous un signe négatif ; ceux-ci ont eu 
un score moyen de 14,28 avec un écart-type de 4,41. La différence 
entre les deux groupes est-elle significative ? 


b) L'échantillon était composé d'hommes et de femmes. Voici les 
données pour chaque groupe : 


Hommes Femmes 
Signe du zodiaque = x = x 
X GS x nx Y Sy ny 
Positif 13,50 4,38 38 13,17 4,57 79 
Négatif 15,52 4,21 38 13,73 4,39 86 


Comparez les deux groupes pour les hommes et les femmes 
séparément. 


Dans une étude sur différents traits de personnalité, Sadowski et Wenzel 
(1982) ont fait passer un test appelé le Buss-Durkee Hostility-Aggression 
Inventory à 157 sujets, dont 61 hommes et 96 femmes. Un score élevé au 
test dénote un haut degré d'hostilité ou d'agression. 


a) Sur l'échelle d'hostilité, les hommes ont eu une moyenne de 6,90 
avec un écart-type de 3,70 ; et les femmes ont eu une moyenne de 
7,45 avec un écart-type de 4,30. La différence entre hommes et 
femmes est-elle significative ? 


b) Sur l'échelle d'agression, les hommes ont eu une moyenne de 26,59 
avec un écart-type de 7,20 et les femmes ont eu une moyenne de 
25,81 avec un écart-type de 6,52. La différence entre hommes et 
femmes est-elle significative ? 
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31. 


32. 


Dans une étude sur la sexualité des jeunes en Australie, Hong (1983) a 
fait remplir un questionnaire à 560 étudiants d'université. Le 
questionnaire rempli permet de calculer un score qui indique dans quelle 
mesure l'attitude du répondant est permissive. 


Voici les résultats : 


Vont à l'église X 6 n 

Régulièrement 3,31 1,54 128 
De temps en temps 4,73 1,10 230 
Jamais 5,24 0,79 202 


Comparez les groupes deux à deux et dites s'il y a des différences 
significatives. (Il existe des techniques qui permettent de comparer 
simultanément les moyennes de plus de deux groupes. Mais ces 
techniques dépassent le niveau de ce livre. C'est pourquoi on vous 
propose de comparer les groupes deux à deux.) 


Pour comparer l'aptitude en mathématiques des Orientaux à celle des 
Américains de race blanche, Tsang (1984) a prélevé les données 
suivantes sur les résultats obtenus au Scholastic Aptitude Test (SAT) par 
10 097 Orientaux et 502 990 Américains de race blanche. 


Score au SAT Orientaux Blancs 
700-800 601 22 564 
600-690 2 001 86 521 
500-590 3 190 158 049 
400-490 2 788 151 466 
300-390 1 309 74 498 
200-290 208 9 892 
TOTAL 10 097 502 990 


a) Testez l'hypothèse selon laquelle la moyenne des Orientaux est égale 
à la moyenne des Blancs. 


b) On aurait pu envisager la solution suivante au problème posé en a) : 
la moyenne pour les Blancs est de 505,762 et l'écart-type est de 
113,011. On pourrait alors songer à tester l'hypothèse selon laquelle 
la moyenne des Orientaux est 1 = 505,762, en utilisant soit 
l'écart-type ©o = 113,011, soit l'écart-type ©& calculé à partir de 
l'échantillon d'Orientaux. Effectuez ces deux tests et discutez de leur 
validité. 


*33. 


*34. 


35. 
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c) Les résultats en a) et b) sont très semblables. Donnez une explication 
intuitive de ce fait. 


Une usine fabrique des vis qu'elle met dans des boîtes de 100. Soit X le 
nombre de vis défectueuses dans une boîte. Pour comparer deux 
procédés de fabrication, À et B, on les emploie à la fabrication de 100 
boîtes chacun. Voici la distribution de X pour chacun des deux 
procédés : 


x 0 1 2 3 4 5 6 TOTAL 
on D RD VÉfe 7 18 9 4 2 100 
. sun 2 13 15 12 5 4 100 


Le patron de l'usine demande à trois statisticiens de tester l'hypothèse 
nulle selon laquelle «les deux procédés sont pareils». Le statisticien X fait 
un test du khi-deux sur le tableau ci-dessus. Le statisticien Y fait un test 
basé sur les proportions de vis défectueuses dans chaque échantillon de 
10 000 vis. Le statisticien Z enfin, fait un test basé sur les nombres 
moyens de vis défectueuses par boîte dans les deux échantillons. 


Effectuez les trois tests et commentez. Sont-ils tous les trois valides ? 


Xavier a lancé nx dés et obtenu un total de 77 points. Yvon a lancé ny dés 
et a obtenu un total de 114 points. Testez l'hypothèse selon laquelle ils 
ont lancé le même nombre de dés. (Utilisez à = 5 %). 


Deux groupes de 11 enfants de troisième année du cycle primaire ont 
complété le test psychologique IAR (Intelligence Achievement 
Responsibility) avant et après une période de 4 mois et demi 
d'expérimentation avec l'un ou l'autre de deux langages informatiques : 
LOGO et Delta Drawing. Contrairement au LOGO, le langage Delta 
Drawing n'attache pas une grande importance à la décomposition d'un 
problème complexe ou à l'apprentissage par la correction des erreurs. Le 
test IAR mesure la tendance du sujet à se croire maître de ses 
apprentissages et de son succès intellectuel. Les chercheurs (Barbara 
Burns et Alison Hagerman) ont voulu montrer que l'exercice du langage 
LOGO augmente cette tendance. Les résultats obtenus sont présentés 
dans le tableau à la page suivante. 
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Effectuez chacun des tests suivants en prenant et à = 10 % et en 
supposant l'égalité des variances. 


a) 


b) 


Testez l'hypothèse selon laquelle les deux groupes étaient, au départ, 
équivalents. 


Testez l'hypothèse selon laquelle les deux groupes étaient, après 
expérimentation, équivalents. 


Testez l'hypothèse selon laquelle l'augmentation au score IAR est la 
même pour les deux groupes. 


Pour chacun des groupes, testez l'hypothèse selon laquelle l'exercice 
du langage informatique ne modifie pas le score IAR. 


Pour chacun des groupes, testez l'hypothèse selon laquelle 
l'augmentation au score IAR est la même pour les garçons et pour les 
filles. 


groupe LOGO groupe Delta Drawing 
du Score IAR te Score IAR 
Avant Après Avant Après 

F 16 29 F 15 21 
F 20 24 M 18 22 
M 21 23 F 21 21 
M 22 21 F 21 19 
M 22 26 F 22 20 
F 23 30 F 22 20 
F 24 26 F 23 23 
F 24 23 F 23 30 
F 25 32 M 26 21 
M 27 34 M 27 25 
M 28 29 M 30 27 


SOURCE Journal of Educational Computing Research (1989), Vol 5(2), pp 199-212). 


36. Un cardiologue du Johns Hopkins Medical Institution a rapporté les 
données suivantes au congrès de l'American Heart Association à Dallas 
en 1986. Il avait observé 103 patients qui avaient eu une attaque du 
cœur et se rétablissaient sans complications. Trente des 103 patients 
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avaient vécu des épisodes « d'ischémie silencieuse », un arrêt intermittent 
du débit sanguin au cœur. Une année plus tard, 9 de ceux-ci mouraient 
d'un arrêt cardiaque. Parmi les 73 qui n'avaient pas connu d'épisode 
d'ischémie silencieuse, 8 seulement mouraient d'un arrêt du cœur. 
Peut-on conclure que ceux qui souffrent de ces ischémies silencieuses 
ont une plus forte probabilité de mourir d'un arrêt cardiaque ? (Source : 
TIME, December 1, 1986) 


Au congrès de l'American Heart Association à Dallas en 1986, des 
chercheurs ont présenté les données suivantes sur 98 femmes dont 51 
avaient été victimes d'une attaque du cœur ; les 47 autres non. Les 
femmes étaient toutes âgées de plus de 50 ans. On a constaté que parmi 
les 51 femmes qui avaient eu une attaque, 12 n'avaient jamais eu 
d'enfants, alors que parmi les 47 autres, 2 seulement n'avaient jamais eu 
d'enfants. (Source : TIME, December 1, 1986). Considérons un tirage 
dans la population d'où sont issues ces patientes (des femmes de plus de 
50 ans), et définissons les événements A et B comme suit : 


A : la personne choisie a une crise cardiaque ; 

B : la personne choisie n'a pas eu d'enfants. 
a) Estimez à partir des données les probabilités P(B | A) et P(B | A5). 
b) Testez l'hypothèse que P(B | A) = P(B | A5. 


c) Des données de ce genre sont généralement prélevées dans le but de 
tester l'hypothèse que le fait d'avoir eu ou pas des enfants n'influence 
pas l'état de santé cardiaque. Or, cette hypothèse se traduit plutôt 
par P(A | B) = P(A | Bi et non par P(B | À) = P(B | A‘. Montrez qu'en 
fait ces deux égalités sont équivalentes. Une façon de le faire est de 
montrer que les deux sont équivalentes à P1Pa = P2P3 OÙ Pi, P2, ps et 
pa sont les probabilités des 4 intersections indiquées dans le tableau 
suivant : 


B BC TOTAL 
A P: P2 P1 + D2 
B Ps Pa P3 + Pa 
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38. 


39. 


Un groupe de 22 000 médecins se sont répartis au hasard en deux 
groupes de même taille. Le groupe expérimental a consommé 325 mg 
d'aspirine chaque deux jours, le groupe témoin a pris un placebo. Dans 
le groupe expérimental, 104 ont eu une crise cardiaque ; dans le groupe 
témoin, 189 ont eu une attaque cardiaque. Que peut-on conclure ? 
(Adapté de TIME, February 6, 1988) 


Le SIDA se transmet-il plus facilement d'un homme infecté à son épouse 
que d'une femme infectée à son époux ? Un article dans le Journal of the 
American Medical Association a rapporté les résultats d'une étude basée 
sur un groupe de 55 femmes et 25 hommes infectés par le virus. En plus 
de deux ans, deux des femmes avaient transmis le virus à leur mari; 
alors que 10 des 25 hommes avaient transmis le virus à leur femme. 
Montrez que la différence est significative. (Source : TIME, March 21, 
1988). 


Les problèmes qui suivent sont de nature différente de ceux qui précèdent. Plus 
théoriques, ils ont pour but d'illustrer certains aspects des tests d'hypothèses qui 
n'ont pas été discutés dans le texte. 


*40. Supposons qu'on sache par expérience que 60 % des rats infectés d'un 


*41. 


certain virus finissent par en mourir. Un chercheur a l'intention 
d'injecter le virus à un groupe de 20 rats afin de tester l'efficacité d'un 
certain médicament. Sa conjecture est que le médicament pourrait 
réduire le taux de décès à 55 % - donc un écart de 5 %. 


a) Si l'écart est effectivement de 5 %, quelle est la probabilité qu'il 
conclue que le médicament est efficace ? 


b) Quelle est la probabilité de conclure que le médicament est efficace si 
l'écart est inférieur à 5 % ? (Il suffit de faire le calcul pour quelques 
valeurs entre 5 % et O % et de donner une explication intuitive des 
résultats.) 


c) Pensez-vous que l'expérience vaut la peine d'être tentée, compte tenu 
des probabilités calculées en a) et b) ? 


Un test d'estime de soi donne normalement un score moyen de 40 avec 
un écart-type (connu) de 16. Une psychologue voudrait vérifier une 
certaine conjecture, soit que les acteurs de théâtre ont un score moyen li 
supérieur à la moyenne. Elle a l'espoir de convaincre au plus 8 acteurs 
de passer le test et vous demande si, avec un échantillon aussi petit, 
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l'expérience vaut la peine d'être tentée. Elle estime que l'écart à = 1 - 
40 entre le score moyen des acteurs et celui de la population générale, 
n'est pas supérieur à 2. 


a) Si effectivement à = 2, quelle est la probabilité de conclure, avec un 
test à 5 %, que u > 40 ? 


b) Quelle doit être la valeur de à pour que, avec un échantillon de taille 
8, la probabilité de conclure que u > 40 soit de 50 % ? (Autre façon 
d'exprimer la question : quel écart peut-on déceler avec une 
probabilité de 50 % ?) 


c) Quelle devrait être la taille de l'échantillon pour que la probabilité de 
déceler un écart de à = 2 soit d'au moins 50 % ? 


Pour étudier l'effet de l'alcool sur les réflexes, on fait passer à 14 sujets 
un test de dextérité avant et après qu'ils aient consommé 100 ml de vin. 
Les scores avant et après sont donnés dans le tableau suivant (ce sont 
des temps de réaction ; donc, un score élevé signifie un ralentissement 
dans les réflexes) : 
Sujet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 
Avant(X) 57 54 62 64 71 65 70 73 68 70 77 74 80 83 
Après(Ÿ) 55 60 68 69 70 73 74 74 75 76 76 78 81 90 


a) Testez l'hypothèse que l'alcool n'a pas d'effet en utilisant le test basé 
sur la loi de Student. 


b) Une autre façon de tester essentiellement la même hypothèse 
consiste à noter seulement la direction du changement, c'est-à-dire 
s'il y a eu baisse ou augmentation du score. Soit U le nombre de 
changements positifs (augmentation du score) et n le nombre de 
changements (qui peut être différent du nombre de sujets si certains 
sujets n'ont pas changé). Alors U est de loi binomiale de paramètre n 
et D. 

il Exprimez l'hypothèse que l'alcool n'a pas d'effet en fonction de p. 


ii) Effectuez un test de cette hypothèse en utilisant comme seule 
observation la valeur de U (et non les scores eux-mêmes). 


c) Les conclusions en a) et en b) sont les mêmes. Maïs supposons que le 
huitième sujet ait obtenu les scores 75 et 74 au lieu de 73 et 74. 


il Testez encore l'hypothèse de deux manières ; 
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+44, 


ii) Expliquez les contradictions dans les conclusions (représentez les 
différences par des points sur une droite ; la raison pour laquelle 
on rejette avec un test et pas avec l'autre devrait devenir 
apparente). 


On utilise généralement le test basé sur les différences Wi = Xi — Yi 
lorsque Xi et Yi sont dépendantes. Mais on l'utilise aussi lorsque Xi et Yi 
sont appariées sans être dépendantes. Supposons, par exemple, qu'une 
psychologue tente de démontrer qu'il est possible de faire croître le score 
d'une personne à un test de rapidité de lecture en lui faisant faire 
certains exercices. Une approche possible est la suivante. On choisit les 
sujets de telle sorte qu'on puisse former des paires de sujets semblables. 
On les accouple selon un critère pertinent comme, disons, l'intelligence. 
Le modèle est le suivant. Pour le i-ième couple, on observe Xi et Yi de 
moyennes pux et luy, respectivement. Ces moyennes peuvent varier d'un 
couple à l'autre. La différence Wi = Xi- Yi, est de moyenne ôi = Luix — puy et 
de variance 62. L'hypothèse nulle est que ôi = O pour i = 1, .…, n. Lorsque 
Ho est vraie, les W sont toutes de moyenne nulle et de même variance o2. 
Supposons donc qu'on ait choisi 14 paires de sujets, chaque paire 
correspondant à un quotient intellectuel donné. Un membre de chaque 
paire est affecté au hasard au groupe expérimental (qui fait des 
exercices), l'autre au groupe témoin (qui n'en fait pas). Supposons qu'on 
obtienne les résultats suivants : 


Paire 1 2 3 4 5 6 7 8 9 10 11 12 13 14 
Témoin 14 14 18 21 23 24 25 25 29 32 32 32 43 45 
Expérimental 17 19 17 23 25 23 27 29 26 35 34 38 45 44 


a) Testez l'hypothèse que les exercices n'ont pas d'effet. 


b) Testez la même hypothèse en supposant cette fois-ci que les données 
n'avaient pas été accouplées. 


c) Comparez l'estimation de l'écart-type de W=X-Y dans les deux 
modèles. La différence explique-t-elle les conclusions contradictoires 
tirées en a) et b) ? 


Il existe d'autres tests pour la différence entre deux groupes. 
Considérons les données de l'exercice 35, disons les scores après 
l'expérimentation. Testez l'hypothèse qu'il n'y a pas de différence entre 
les deux groupes en suivant les étapes décrites ci-dessous. 
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Rangez les données des deux groupes en ordre croissant, puis 
repérez la médiane des 22 données. 


Dressez un tableau 2 x 2 contenant les données suivantes : 


Nombre d'éléments du premier groupe Nombre d'éléments du deuxième groupe 
au-dessus de la médiane au-dessus de la médiane 
Nombre d'éléments du premier groupe Nombre d'éléments du deuxième groupe 
au-dessous de la médiane au-dessous de la médiane 


Expliquez en quel sens un test du khi-deux d'indépendance constitue 
un test de l'hypothèse selon laquelle il n'y a pas de différence entre 
les groupes LOGO et le groupe Delta Drawing. 


Le test effectué en c) ne contredit pas la conclusion énoncée au 
numéro 35. Pouvez-vous imaginer des données (quelques 
modifications de celles-ci, par exemple) où il y aurait contradiction 
entre les deux conclusions ? 


Mise en garde Le test qui est proposé ici exige des effectifs 
généralement supérieurs à ceux qui ont servi à cet exercice. 


Lors d'un projet d'étude des problèmes de racisme dans une force 
policière, on prélève un échantillon de 32 policiers, dont 16 ont 11 ans de 
scolarité ou moins et 16 ont plus de 11 ans de scolarité. Chacun des 
deux groupes est divisé en deux sous-groupes de 8. L'un des deux 
sous-groupes suit un cours de sensibilisation aux groupes ethniques, 
l'autre pas. Le tableau suivant donne les résultats à un test d'hostilité 
aux groupes ethniques. 


Niveau de scolarité 


<11 ans > 11 ans 

60 58 56 54 36 36 33 32 
N'ont pas suivi 
le cours de 52 50 48 46 30 29 26 26 
sensibilisation L ; 

Ex = 424,>x° = 22 640 Ex = 248,>x° —7 798 

50 48 46 44 30 28 26 24 
Ont suivi 
le cours de 42 40 38 36 22 20 28 26 


sensibilisation 


Ex = 344, 3x? = 14 960 Ex = 204, 2x? =5 280 
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a) Montrez que le cours de sensibilisation a eu un effet pour les policiers 
ayant 11 ans de scolarité ou moins. 


b) Montrez que le cours de sensibilisation a eu un effet pour les policiers 
ayant plus de 11 ans de scolarité. 


c) Montrez que si l'on ne fait pas cas du niveau de scolarité, on ne 
trouve pas de différence significative entre ceux qui ont suivi et ceux 
qui n'ont pas suivi le cours de sensibilisation. 


*46.Supposons que la durée (en milliers d'heures) des pièces électroniques 
d'un certain type est de loi exponentielle de paramètre 0. Pour tester 
l'hypothèse Ho : 0 = 10, on tire une pièce au hasard et on observe sa 
durée X. Considérez les deux tests suivants : 


TEST 1 : on rejette Ho si X < 0,5. 
TEST 2 : on rejette Ho si X < 0,2. 


Le but de ce problème est d'étudier les avantages et désavantages relatifs 
de ces deux tests. 


a) Déterminez la probabilité de rejeter Ho si Ho est vraie : i) lorsqu'on 
utilise le test 1 ; ii) lorsqu'on utilise le test 2. 


Lequel des deux tests paraît meilleur avec ce critère ? 


b) Vérifiez les probabilités dans le tableau suivant 


Valeur Probabilité de rejeter Ho 
de 0 Test 1 Test 2 
9 0,054 0 0,022 0 
5 0,095 2 0,039 2 
0,5 0,632 1 0,329 7 
0,1 0,993 3 0,864 7 
0,05 0,999 95 0,981 7 


Lequel des deux tests semble meilleur à la lumière de ces calculs ? 


c) Supposons qu'on décide qu'on rejettera Ho si X < a. Quelle doit être 
l'a valeur de a si l'on veut que la probabilité à de rejeter Ho à tort soit 


) 5%? il 1%? ii) 0,5%? 
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*47. Supposons que le nombre de fautes typographiques dans une page est 
de loi de Poisson. Considérez deux procédures pour tester l'hypothèse Ho 
que le nombre moyen 8 d'erreurs par page dans un livre est 1. 


Procédure 1 : on tire une page au hasard ; on rejette H si le nombre 
d'erreurs X est supérieur ou égal à 4. 


Procédure 2 : on tire deux pages au hasard ; on rejette Hs si le nombre 
total d'erreurs Y dans les deux pages est supérieur ou égal à 6. 


a) Déterminez la probabilité de rejeter Ho si Ho est vraie : i) lorsqu'on 
utilise la procédure 1 ; ii) lorsqu'on utilise la procédure 2. Lequel des 
deux tests paraît meilleur avec ce critère ? 


b) Vérifiez les probabilités dans le tableau suivant : 


Valeur Probabilité de rejeter Ho 
de 6 Procédure 1 procédure 2 
1,0 0,019 O 0,016 6 
1,2 0,033 8 0,035 7 
1,3 0,043 1 0,049 0 
1,4 0,053 7 0,065 1 


Lequel des deux tests semble meilleur à la lumière de ces calculs ? 


c) Supposons qu'on décidera de rejetter Ho si X > a. Quelle doit être la 
valeur de a si l'on veut que la probabilité a de rejeter Ho à tort soit 
inférieure ou égale à 1 % ? 
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Introduction Nous avons jusqu'ici présenté un seul mode d'échantillonnage : 
l'échantillonnage aléatoire simple, dans lequel on effectue n tirages 
indépendants, chaque fois dans la population entière. Cette description 
convient à certains types de sondages et à un grand nombre d'expériences 
scientifiques. Lorsqu'on pèse r rats soumis à un certain traitement, les n 
poids peuvent être considérés comme les résultats de n tirages d'une même 
population. La population est infinie puisqu'elle représente l'ensemble de 
tous les poids qu'on pourrait théoriquement observer. Il est donc raisonnable 
de prendre pour modèle nr variables aléatoires X ,,X,...,X, ,indépendantes 


et de même loi. 


Certains sondages, auprès de grandes populations, obéissent à peu près à ce 
modèle. Ce sont les sondages dont le procédé simule le tirage aléatoire de 
boules dans une urne : d'une liste complète des éléments de la population, 
on tire successivement n éléments, en donnant à chaque fois une 
probabilité de sélection égale pour tous les éléments. Une municipalité peut 
échantillonner les logements de la ville de cette façon, puisqu'elle dispose 
généralement d'une liste des logements. L'administration d'une compagnie 
peut utiliser cette approche pour choisir un échantillon d'employés. 


Remarque Un sondage téléphonique est parfois considéré comme un 
échantillon aléatoire simple, bien qu'il soit abusif de le considérer comme un 
échantillon de ménages : certains ménages ont plus d'un numéro de téléphone 
et donc plus de chance que les autres d'être choisis ; alors que d'autres 
ménages, sans téléphone, n'ont aucune chance d'être choisis. Il s'agit donc 
d'un échantillon aléatoire simple de la population de numéros de téléphone. 
Dans les sondages informels, comme ceux que peuvent mener certains 
journalistes, on ne tient pas compte de ce problème, ce qui est équivalent à 
supposer que, dans la très grande majorité des cas, un ménage a exactement 
un numéro de téléphone. Les sondages plus sophistiqués font généralement 
des ajustements pour compenser le fait que les ménages avec plusieurs 
téléphones ont plus de chance d'être représentés - mais ils ne peuvent toujours 
pas inclure dans un sondage téléphonique les ménages sans téléphone. 


Pour plusieurs raisons, des raisons de commodité, d'économie ou de 
précision, on pratique souvent un mode de sondage plus complexe que 
l'échantillonnage simple décrit plus haut. Un sondage d'opinion auprès de la 
population canadienne est un exemple typique. Il ne serait pas aisé de 
dresser une liste de tous les adultes canadiens. On commence normalement 
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par stratifier la population, c'est-à-dire la répartir en sous-populations. Une 
répartition selon la province est un début naturel, mais on ne s'arrête pas là. 
On voudra également séparer les régions urbaines des régions rurales, ainsi 
que les très grandes agglomérations des plus petites. On décidera sans doute 
que les quelques grandes villes devront toutes être représentées, mais pas 
tous les villages. Dans les villages on choisira des logements, alors que dans 
les villes on commencera peut-être par faire un choix de quartiers, puis de 
rues, puis de logements. Ce qui résulte d'une telle procédure est un 
échantillon dont les propriétés sont très différentes de celles d'un échantillon 
aléatoire simple. 


À part l'échantillonnage aléatoire simple, les procédures les plus courantes 
sont l'échantillonnage stratifié, l'échantillonnage systématique, et 
l'échantillonnage en grappes. Dans ce chapitre, nous présenterons 
l'échantillonnage stratifié ; les deux autres techniques ne seront que 
brièvement décrites. Une caractéristique commune à toutes ces techniques, 
connues sous le nom de techniques de sondage, c'est qu'elles présupposent 
une population finie dont on peut énumérer les éléments. Cette seule 
différence entraîne des changements à la théorie développée dans les 
chapitres précédents, même dans le cas de l'échantillonnage simple. Nous 
commençons par discuter ces changements. 


10.1 


ÉCHANTILLONNAGE D'UNE POPULATION FINIE 


Aux chapitres 8 et 9, nous nous sommes limités aux modèles qui supposent 
une population infinie. Ces modèles s'appliquent dans l'une ou l'autre des 
conditions suivantes : 


1. La population est réellement infinie. Lorsqu'on estime le poids moyen 
d'un bébé à la naissance, par exemple, la population, idéalisée, est 
l'ensemble théoriquement infini de tous les bébés possibles. 


2. La population est finie, mais les tirages se font avec remise. Ce mode 
d'échantillonnage, dans lequel un même élément de la population peut se 
retrouver plus d'une fois dans l'échantillon, est pratiqué dans certaines 
circonstances particulières mais il n'est pas très courant. Un exemple est 
mentionné dans la section 10.6 sur l'échantillonnage en grappes. 


3. La population est si grande comparée à l'échantillon qu'on peut, à toutes 
fins pratiques, la considérer infinie, même si les tirages se font sans 
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remise. Un sondage sur les opinions des Canadiens, par exemple, est 
généralement constitué d'un échantillon d'au plus quelques milliers ; la 
population est de plusieurs millions. 


Le troisième cas ci-dessus est le plus fréquent, et c'est la grande taille de la 
population qui motive le recours à l'échantillonnage. Il existe toutefois des 
cas où la population est petite, assez petite pour que les tirages ne soient 
plus indépendants, même approximativement. Typiquement, c'est le cas où 
l'échantillonnage s'impose non pas par la grande taille de la population mais 
par le coût élevé des observations. Supposons, par exemple, qu'une 
municipalité se propose d'étudier la qualité du sol dans ses parcs. Si les 
analyses chimiques sont longues et coûteuses, on trouvera trop onéreux 
d'obtenir les données sur tous les parcs, même si le nombre de parcs n'est 
pas énorme. On se contentera donc d'un échantillon, lequel, bien sûr, sera 
tiré sans remise. 


Nous verrons que les propriétés des estimateurs se trouvent modifiées par le 
fait que les observations ne sont pas indépendantes. Heureusement, la 
modification est relativement mineure et n'affecte que la variance de 
l'estimateur. 


Notation Les éléments de la population sont des nombres que nous 
dénoterons par 


VV Vu 


où N désigne la taille de la population. La taille de l'échantillon sera notéen, 
comme d'habitude. La moyenne H et la variance 6 ‘de la population sont 
définies de la même façon qu'au chapitre 2, soit 

1» 


D»: CS => (, un}. 


1 

N i=1 N i=1 
Estimateur de la moyenne La moyenne arithmétique X est encore 
l'estimateur ponctuel de L , et elle est sans biais dans ce contexte également, 
c'est-à-dire, E(x)-u. Nous devrons estimer l'écart-type de X afin de 


construire un intervalle de confiance pouru. On estime l'écart-type de X 


e) n 6 
8,= == —ÿ1-f, 
Ja \ NN n 


par 
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La À 2 : 5 $ D . 
où © est la variance échantillonnale définie par 


et f =n/N est appelée fraction (ou taux) d'échantillonnage. 


Remarque Rappelons que lorsque la population est infinie, la variance de 
X est estimée par 6” / n. Ce qui change, donc, c'est le facteur 1- f, appelé 


facteur de correction : 


n 
Facteur de correction=1- f =1-— 


qui est inférieur à un et donc a pour effet de diminuer l'écart-type de X. Le 
taux d'échantillonnage f est la quantité déterminante. Si f est petit, 


c'est-à-dire, si l'échantillon est petit par rapport à la population, le facteur de 
correction est proche de 1, et la variance ne diminue que de peu. Inversement, 
si f est grand, le facteur de correction est beaucoup plus petit que 1 et la 


variance est réduite considérablement. 


Formule de calcul On a déjà fait remarquer que la somme des carrés, 


Ex ne x Ÿ , au numérateur de 6°, est équivalente à la différence 
ZX é —nX°, ce qui donne la formule suivante pour le calcul de 6°. 


n 2 V2 
. Six, = nX 


n-1 


22 
[e} 


Intervalle de confiance pour la moyenne Nous avons donné au chapitre 8 la 
formule suivante pour un intervalle de confiance : 
X-co_-<n<X+c6.-, 
(0 PRES 7à a X 
où c, est trouvée dans la table de la loi de normale ou de la loi de Student. 


Lorsque la population est finie, la formule demeure la même dans sa forme 
extérieure. Mais il y a deux changements : 
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1. Il n'existe pas de théorie exacte pour des petits échantillons et une 
population normale, basée sur la loi de Student. Donc, la formule ne 
peut être utilisée que lorsque l'échantillon est grand, et la valeur de c,, 


vient généralement de la table de la loi normale. 
2. L'estimateur 6 x de l'écart-type, qui est 6 In pour une population 
infinie, est modifiée par le facteur /1- f. 


La formule complète pour un intervalle de confiance est donc 


Remarque Rappelons les conditions dans lesquelles les intervalles de 
confiance ont été développés au chapitre 8. Nous avons proposé deux 
procédures. L'une est basée sur la supposition que la population est normale ; 
l'autre s'appuie sur le théorème limite central. Les deux procédures sont 
invalidées par le fait que la population n'est pas infinie : la première parce que 
la notion de normalité se définit mal dans le cas des populations finies ; et la 
deuxième parce que le théorème limite central exige que les variables soient 
indépendantes, hypothèse qui nest pas vérifiée lorsque les tirages se font sans 
remise. Îl est vrai qu'on peut donner une définition intuitive de la normalité 
d'une population finie : la population est normale si l'histogramme des valeurs 


v,,...,v, à la forme symétrique d'une fonction de densité normale. Dans la 


mesure où cet histogramme prend la forme d'une loi normale, la distribution de 
la variable X aura effectivement tendance à être normale. Cet énoncé plutôt 
vague devra remplacer le théorème énoncé rigoureusement au chapitre 7 : si la 
population est normale, X est normale. Quant au théorème limite central, il en 
existe une version pour les populations finies qui permet de conclure à la 
normalité de X. Nous ne l'énonçons pas ici, mais notons qu'il faut non 
seulement que n soit grand, mais que N-n le soit aussi. Ainsi la moyenne 
d'un échantillon de taille 1 000 est normale si la population est de taille 
1 000 000, mais pas si la population est de taille 1 010. 
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Exemple 1 D'une population de N=8427 comptes à recevoir, on prélève un échantillon 
de taille n=30 afin d'estimer la valeur moyenne d'un compte. Voici les 


résultats, en dollars : 


240,82 232,50 740,81 860,32 224,10 7,15 
324,11 240,12 10,02 190,08 182,75 160,20 
148,22 41,10 119,25 113,85 108,30 107,10 
101,19 9,15 99,21 93,12 88,13 80,15 

78,13 72,15 67,13 65,14 132,19 32,17. 


Estimer la moyenne de la population et l'écart-type de l'estimateur et 
déterminer un intervalle de confiance à 95 % pour lu. 


Nous avons 


ZX, = 4968,66, TX. = 1864 906,49. 


L'estimateur de la moyenne est 


X = 4 968,66 / 30 = 165,62 $. 


L'écart-type 6 de l'échantillon, et l'écart-type © x de l'estimateur sont 


.. [EX?-nX? [1864 906,49 - 30(4 968,66 / 30)? 
6 : : = 1e 35 930,59 = 189,55 
n-1 30 -1 


. «% n 4/35 930,59 30 
S_=—1-—- 1 34,61,/1-0,003 56 = 34,55. 


N 30 8427 


Le facteur de correction n'est pas important ici : s'il avait été omis, l'écart- 
type aurait été estimé à Se = 34,61, assez proche de la valeur 34,55 calculée 


plus haut. L'intervalle de confiance est donné par 


X-co_<u<X+c 6. 
a XX X 


œ 


X = 165,62,6 ; = 34,55,et à 95 %, c, =1,96. Donc, l'intervalle est 


165,62 -1,96(34,55)< u < 165,62 +1,96(34,55), 
97,90 < u < 233,34. 


Exemple 2 
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L'intervalle, très large, montre que, étant donné la dispersion importante de 
la population (6 = 189,55), l'échantillon n'est pas assez grand pour donner 
une meilleure précision. 


Évidemment, ces résultats sont approximatifs, puisque la normalité de la 
population est très douteuse et l'échantillon n'est pas très grand. + 


Estimation d'un total Nous avons, dans le cas fini, un paramètre qui n'est pas 
définissable dans une population infinie. C'est le total des données de la 
population, que nous noterons t. Puisque t = Nu, le problème n'est pas 


nouveau. t est estimé par Tt=NX, et l'intervalle de confiance pour t est 
calculé en multipliant par N les limites de l'intervalle de confiance pour u 


Dans l'exemple 1, on estime la valeur totale des comptes à recevoir par 
T=NX = 8 427(165,62) = 1 395 679,74 $. Un intervalle de confiance est 


donné par 8 427(97,90) <rt < 8 427(233,34), soit 825 003 <t < 1 966 356. 


10.2 


ÉCHANTILLONNAGE STRATIFIÉ - ESTIMATION D'UNE MOYENNE 


Il arrive qu'une population soit naturellement divisée en sous-populations : 
la population d'un pays est répartie en régions géographiques ; les clients 
d'une compagnie sont des particuliers, des détaillants ou des grossistes ; les 
étudiants d'une université appartiennent à l'une ou l'autre des facultés ; les 
employés d'une compagnie relèvent de différents services ou succursales. Si 
l'on veut échantillonner cette population pour estimer quelque paramètre, il 
est parfois commode de prélever un échantillon dans chacune des sous- 
populations pour les réunir ensuite. Les sous-populations sont alors 
appelées des strates, et le mode d'échantillonnage est appelé 
échantillonnage stratifié. Précisons la notation et la procédure. La 
population est formée de K strates, et 


N,,N,,...,N, dénotent les tailles des strates ; 


U,,H,,..u, dénotent leurs moyennes ; et 


2 2 . 
.,6, dénotent leurs variances. 
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Nous considérons le cas où dans chaque strate on prélève un échantillon 
aléatoire simple (tirages successifs, sans remise). Nous avons donc K 
échantillons, et 


n,,n,,..,n, dénotent les tailles des échantillons ; 
X,,X,,..., X, dénotent leurs moyennes ; et 

22 22 22 y: : 

6,,0,,...,0, dénotent leurs variances. 


FIGURE 10.1 Illustration d'un échantillon stratifié 


Population 
(taille N) 


Échentillons D x 6 8 ©: D ------- 


Données échantillonnale: 


La situation est schématisée dans la figure 10.1. Puisque les échantillons 


sont prélevés séparément, les moyennes X,,X,,...,X, sont des variables 


indépendantes qui estiment, respectivement, les paramètres L,,lu,,..,1u,. 
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Pour chacune des strates, les paramètres, les estimateurs et leurs propriétés 
sont exactement ceux présentés dans la section 10.1. Pour i=1,2,...,K, 


l'estimateur de u, est % et l'écart-type de a est estimé par 


où f,=n, / N,. Donc, rien de nouveau en ce qui concerne l'estimation des 


paramètres des strates. Rappelons toutefois que la population cible est la 
réunion des strates, et que les paramètres que l'on veut estimer sont ceux de 
la population entière. Il faudra donc réunir les données des K échantillons 
de façon à obtenir un estimateur de la moyenne de la population. La 
moyenne 1 de la population peut être exprimée en fonction des moyennes 


u, des strates : 


Nu +Nu,+.+Niu, NN N N 


1 2. K 
u = = U, + M, +..+—pn,. 
N N d : 


Les proportions N/N,N IN, N,/N sont les tailles relatives des K 
strates. Nous les noterons W,W,,...,W,. Nous pouvons exprimer h en 
fonction des W, =N,/N : 


K 
u=Wp+Wu,+..+Wiu, =DWu. 
i=1 


Pour estimer li, il suffit de remplacer chaque hu, dans l'expression ci-dessus 


par son estimateur X .. On a alors l'estimateur H défini par 
A ur Le DEA : PTE 
D=WX +W,X,++W,X, =DWX.. 
i=1 


L'écart-type de à est estimé par 


326 Introduction à la statistique appliquée 


Exemple 3 


Pour estimer la superficie moyenne des maisons et appartements d'une ville, 
on commence par classer les habitations en trois strates : 
Strate 1 : Nouvelles maisons construites sur l'ancien terrain de golf ; 
Strate 2 : Vieilles maisons ; 
Strate 3 : Appartements, duplex et autres. 


On prélève un échantillon de chacune des strates. Les tailles des strates et 
des échantillons sont 


N,=80 N,=200 N,=500 


Voici les superficies des maisons ou appartements dans les trois échantillons 
(en mètres carrés) ainsi que quelques calculs : 


Strate 1 
466 428 506 394 458 408 373 429 397 367 
ZX, =4226, X,=422,6, Z X? =1803 308, 
6! = (19): 803 308 -10(422,6)° ]=1938,878. 
Strate 2 
301 319 232 228 268 201 233 220 261 203 
261 370 214 242 296 234 280 270 259 195 
ZX,=5087, X, =254,35, Z X? =1330 573 
ose (19) 330 573 -20(254,85) }-1981,292. 
Strate 3 


234 178 197 160 156 141 171 194 203 160 
224 186 150 182 174 205 190 171 183 155 
180 173 212 149 160 139 149 180 182 167 


EX,=5305, X, =176,83, Z X? - 954 313, 


a (1/29)(954 313-30(176,83)° É 559,040. 
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La taille de la population est N =80 + 200 + 500 + 780 ; les tailles relatives 
des strates sont W, = N, /N = 80/780 = 8/78 = 0,1026, W,=N,/N=20/78% 
0,2 564, W,=N,/N=50/78 # 0,6 410. La moyenne de la population est 


estimée par 
: 8 20 50 
u=| — |1422,6+| — |254,35 +| — |176,83 = 221,91. 
78 78 78 


La variance de li est estimée par 
., (8 \*1933,378/ 10) [20 \* 1931,292 20 
G< = 1 + 1 
# 78 10 80) |78 20 200 


50 \? 559,040 30 
+ 1 
78 30 500 


= 1,780 +5,714 +7,198 = 14,692. 


Donc, l'écart-type estimé de 14,692 =3,833, et un intervalle de confiance 
approximatif à 95 % pour u est H +1,966 à = 221,91+1,96(3,833), soit 


214,4<u < 229,4. 


Remarque Plusieurs chercheurs effectuent des analyses à partir des données 
publiées dans des documents officiels. Souvent, ils supposent que les données 
sont issues d'un échantillon aléatoire simple alors qu'elles peuvent avoir été 
obtenues par un échantillon stratifié. C'est une erreur dont les conséquences ne 
sont pas négligeables. Supposons, dans l'exemple 3, qu'on considère les n = 60 
données comme si elles constituaient un échantillon aléatoire simple d'une 
population de taille N = 780. On aurait alors estimé la moyenne par X, un 
estimateur qui n'est pas sans biais dans une situation comme celle-ci où 
certaines strates sont proportionnellement mieux représentées que d'autres. 
Nous aurions obtenu, en effet, X=243,633, au lieu de 221,91. Cette 
surestimation est attribuable au nombre proportionnellement grand d'unités 
appartenant aux deux premières strates. L'écart-type de X aurait également été 


mal estimé : nous l'aurions estimé par la formule [s/4n Ni =11,720, et notre 
intervalle de confiance aurait été 


220,7 < u < 266,6. 
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Cet intervalle est beaucoup plus long que l'intervalle obtenu correctement plus 
haut. Il se trouve que l'erreur n'est pas grave dans la mesure où elle donne une 
vision plutôt pessimiste : l'estimation est de fait plus précise que ne laisse 
croire l'intervalle. Dans certains cas, une procédure erronée peut donner lieu à 
des résultats indûment optimistes, ce qui est plus grave. 


10.3 


Exemple 4 


ALLOCATION DES OBSERVATIONS 


Supposons que la valeur de n est fixée à partir de considérations 
économiques. Comment doit-on répartir cet effectif total entre les strates ? 
Dans l'exemple 3, l'échantillon total est de taille n = 60, réparti ainsi :n,, = 
10, n,= 20, et n,= 30. Les même 60 observations auraient pu être allouées 
différemment. Quelles sont les conséquences des différentes allocations ? Les 
conséquences sont en fait importantes, car la variance de l'estimateur en 
dépend. D'ailleurs, la stratification n'est pas toujours imposée par la nature : 
on y recourt souvent volontairement, précisément dans le but de réduire la 
variance de l'estimateur. 


Utilisons les estimations 6 / =1 933,378, 6; =1 931,292 et o; = 559,040 


obtenues des données de l'exemple 3 pour estimer l'écart-type de 1 pour 


différentes allocations #,,n,,n,.Pour une allocation donnée des 60 


observations, l'écart-type de hi est estimé par 


2 2 2 2 2 22 
8 5; ; n, in 20) 6; : n, é 50 | 6; ; n; | 
78) n,\ 80) (78) n, | 200) (78) n,\ 500 


Voici l'écart-type de à qui résulte de quelques allocations possibles : 


Allocation EAU Fra 
cart-type de 
(9,22,29) 3,82 
(6,15,39) 4,05 
(20,20,20) 4,18 
(30,10,20) 4,85 


(50,5,5) 8,39 + 
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Nous voyons que l'allocation a un effet important sur l'écart-type. Deux types 
d'allocation sont utilisés couramment : l'allocation proportionnelle et 
l'allocation optimale. 


Allocation proportionnelle Une allocation naturelle est l'allocation 
proportionnelle, qui répartit l'échantillon de la même façon que la population : 
les n, sont proportionnels aux N., (ou aux W., ce qui revient au même). Nous 


avons approximativement les égalités suivantes : 
n =nW. 
Li 1 


Dans l'exemple 3, l'allocation proportionnelle donne 


n, = 60(8/)= 6, n, = 60(20 L)= 15, n, = 60(50 Le) 39. 


Nous voyons aux calculs de l'exemple 4 que l'allocation proportionnelle n'est 
pas la meilleure : elle donne un écart-type de 4,05, alors que pour 
l'allocation (9, 22, 29), l'écart-type est de 3,82. 


Si l'allocation proportionnelle n'est pas la meilleure, peut-on néanmoins dire 
qu'elle est relativement bonne ? En particulier, un échantillon stratifié avec 
allocation proportionnelle est-il préférable à un échantillon non stratifié ? La 
réponse est oui, à condition que les moyennes des strates soient assez 
différentes les unes des autres. Cette condition est vérifiée dans la plupart 
des cas car c'est précisément lorsque les strates sont très différentes qu'il est 
naturel de stratifier. 


Allocation optimale Nous avons vu que même si l'allocation proportionnelle 
est généralement bonne, il y en a de meilleures. Est-il possible de trouver la 
meilleure de toutes ? Plus précisément, étant donné un nombre total n 
d'observations, y a-t-il moyen de les répartir entre les strates de façon à 
minimiser la variance de { ? Il y a effectivement une allocation unique pour 


laquelle la variance (et donc l'écart-type) de 4 est minimale ; elle est appelée 


allocation optimale. Puisque cette allocation dépend des variances des 
strates, nous supposons ces variances connues pour le moment. On peut 
démontrer que l'allocation optimale est donnée par 


les n proportionnels aux quantités W. 


où l'égalité approximative est vraie dans la mesure où les N, sont grands. 
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Exemple 5 Considérons une population répartie en 4 strates dont les paramètres sont 
les suivants. 


i 1 2 3 4 
N, 100 200 300 400 
(e 365 38 14 5 


Déterminons l'allocation optimale d'un échantillon de taille 50. Les valeurs 
de Wo, sont 


(0,1)(365), (0,2)(38), (0,3)(14), (0,4)(5), 
soit 36,5 7,6 4,2 2,0. 


La somme de ces nombres est 50,3, et l'allocation optimale est donnée par 


Pour un échantillon de taille 50, l'écart-type de üest plus petit avec cette 
allocation qu'avec toute autre. + 
Nous pouvons aisément déterminer une formule précise pour les n, : dire 
que les », sont proportionnels aux Wo,, c'est dire que pour une certaine 


constante a,n, = aWo, ; puisque Zn; = n, alors 
ZaWo,=n—a>Wo,;=n—a=n/2Wo.. 
Nous avons donc la formule suivante pour n, : 


Wo. 


L: I 
NE —————"n". 
i k 
> _Wo., 
Î=l À j 


Paramètres inconnus Pour déterminer l'allocation proportionnelle, il suffit de 
connaître les W,. Pour déterminer l'allocation optimale, par contre, il faut 


aussi connaître les 6, . Or, les 6, sont des paramètres de la population et 


sont donc inconnus. Il n'y a pas de solution générale à ce problème : en 
pratique on tente, d'une façon ou d'une autre, d'obtenir une estimation des 


Exemple 6 
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6, : soit par un échantillonnage conçu à cette fin, soit en se basant sur des 
données semblables prises dans d'autres populations. 
Strates recensées Il peut arriver que la formule pour l'allocation optimale 
donne pour certaines strates une valeur de n, supérieure à N,. Dans ce cas, 


on prélève toutes les unités des strates en question, et on utilise l'allocation 
optimale pour les autres strates. 


Considérons une population de taille N = 130 répartie en trois strates 
d'effectifs 15, 40 et 75, respectivement, et d'écarts-types 28 313, 2 032 et 
276, respectivement. Quelle est la répartition optimale d'un échantillon de 
taille 25 ? 


Les valeurs de Wo, sont 3 267, 625 et 159 et leur somme est 4 051. Donc, 


l'échantillon doit être réparti selon les proportions 3 267/4 051 = 0,81, 
625/4 051 = 0,15 et 159/4 051 = 0,04. 


L'allocation est donc 


n, =(0,81)(25)=+ 20, », =(0,15)25)+ 4 et n, =(0,04)(25) + 1. 


Il est impossible de prélever un échantillon de taille 20 dans la première 
strate, qui ne contient que 15 éléments. On en prélèvera donc 15, la strate au 
complet ; et on répartira ensuite les 10 observations qui restent entre les deux 
dernières strates. Les 10 observations seront réparties proportionnelle- 
ment aux nombres 625 et 159, dont la somme est 784. Les tailles des deux 
derniers échantillons sont donc n, = (625/784)(10)+ 8, n, = (159/784)(10) + 2. La 


moyenne est estimée comme d'habitude par H=WX +W,X,+W,X, mais 
puisque WX .=Wu,, le premier terme est fixe et sa variance est nulle. La 


formule usuelle pour l'estimateur de la variance s'applique quand même ; on 
verra que le premier terme est automatiquement nul à cause du facteur de 
correction 1—-n /N =1-N /N =0. 


10.4 


ESTIMATION D'UNE PROPORTION 


Un échantillonnage par stratification peut être employé profitablement pour 
estimer une proportion p. La théorie ne change pas, car une proportion est 
une moyenne : c'est la moyenne d'une variable dichotomique, c'est-à-dire, 
une variable qui ne prend que les valeurs 0 et 1. Par exemple, si p est la 
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proportion de fumeurs dans une population de N personnes, alors 
P = G/N)Ev,, où v, est égal à 1 sila ; -ième personne est fumeuse et v:=0 


sinon. Donc, p est identique à ce que nous avons noté L dans les sections 


précédentes. Les proportions des strates seront dénotées par p,, (au lieu de 
u,), et les proportions échantillonnales par p. (au lieu de X .). La moyenne 


pondérée que nous avons notée X sera ici notée D : 
A A A A K A 
P=W,Pp, +W,P, +...+W,px = D Wp,. 
i=1 


La nature dichotomique de la variable permet de donner des expressions 
plus simples pour les variances. On peut montrer que pour une variable 
dichotomique la variance échantillonnale de la strate ; devient 


la dernière égalité approximative n'étant vraie que si les n, sont grands. Il n'y 


a pas d'autre changement de notation : les formules pour les estimateurs des 
écarts-types des p, et de p sont identiques à celles pour les X et pour X : 


pour p. 


Exemple 7 
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Le paramètre rt défini dans la section 10.1 devient ici t = Np et représente 
un effectif : si p est la proportion de fumeurs dans une population, rt est le 
nombre de fumeurs dans la population. 

Pour estimer la proportion d'employés en faveur d'un plan de soins 
dentaires, on prélève un échantillon aléatoire simple dans chacune des 4 
divisions de la compagnie. Les effectifs des 4 divisions sont 4 523, 3 456, 


1300, 1124, et les tailles des échantillons sont 22, 17, 6 et 5, 
respectivement. Le nombre de personnes favorables est 10, 5, 3, et 3. 


a) Les W. sont 4 523/10 403 = 0,434 8 ; 3 456/10 403 = 0,332 2 : 
1 300/10 403 = 0, 125 O ; 1 124/10 403 = 0,108 O. 
Les p, sont 10/22 = 0,454 5 ; 5/17 = 0,294 1 ; 3/6 = 0,5 ; 3/5 = 0,6. 
Donc p = (0,434 8)(0,454 5) + (0,332 2)(0,294 1) + (0,125 O)(0,5) 


+ (0, 108 O) (0,6) = 0,422 6. 


On estime que 42,26 % des employés de la compagnie sont en faveur 
du plan. Donc, on estime que le nombre d'employés en faveur du plan 
est 


T = 10 403 x 0,422 6 = 4 396. 


b) la variance de p est 


alal, A ol, ua 


10 403 21 4523) | 10403 16 3456 
1300 }” (0,5)0,5) _S 1124 Ÿ (0,6)(0.4) sue 
L + 
10 403 5 1300 | | 10403 4 1124 
= 0,005 12. 


L'écart-type de p est donc 40,005 12 =0,0716. 


c) Un intervalle de confiance approximatif à 95 % pour p est donné par 


p +1,966 ; où p=0,4226 et 5; =0,0716, soit 


0,2823<p<0,562 9. 
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Exemple 8 


Avec 95 % de confiance, on peut affirmer qu'il y a entre 28,2 % et 
56,3 % d'employés en faveur du plan. 


d) Nous pouvons déterminer un intervalle de confiance approximatif 
pour t en multipliant les deux bornes par N = 10 403. Nous 
obtenons : 


2937 <t <5 856. 


Nous pouvons affirmer avec à peu près 95 % de confiance que le nombre 
d'employés en faveur du plan se situe entre 2 937 et 5 856. + 


Allocation optimale L'allocation optimale est, bien sûr, toujours la même, soit 
approximativement 


les n, proportionnels aux Wo. 
l l l 


où (Cu = p(1- p.) 
Il peut arriver, en l'absence d'information sur les p,, qu'on les suppose 


égaux. Dans ce cas, l'allocation optimale est une allocation proportionnelle. 
En pratique, la supposition que les p, sont égaux ne sera pas vérifiée. 


Cependant, la formule ci-dessus montre que l'allocation optimale dépend des 
produits p, (1 - p.) et non des p, eux-mêmes. Or, en général les valeurs du 


produit p, (1 — p.) ne varient pas beaucoup, à moins que les p, s'éloignent 
beaucoup de 1/2. Donc, à moins que les valeurs des p, soient extrêmes, 


l'allocation optimale n'est pas tellement différente de l'allocation 
proportionnelle. 


Les 3 strates d'une population contiennent respectivement 175, 375 et 450 
unités. Nous considérons la répartition optimale d'un échantillon de taille 
100 sous deux hypothèses : (i p, =0,4, p, =0,5, p, =0,6, et (ii) 


P, = 0,05, p, = 0,15, p, = 0,25. Les valeurs de W, sont 0,175, 0,375, 0,450. 


Sous l'hypothèse (i) les valeurs de Woo, =W,[p, i- P; ) sont 0,085 7, 0, 1875, 
0,220 5, leur somme est 0,493 7, et l'échantillon doit être réparti selon les 
proportions 0,085 7/0,493 7, 0,187 5/0,493 7, 0,220 5/0,493 7, ce qui 
donne environ n, = 17, 38 et 45. Sous l'hypothèse (ïi) les n, sont 10, 37, 53. 

On voit bien que la première répartition, le cas où les p, sont proches de 


0,5, est essentiellement la répartition proportionnelle. 
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10.5 


ÉCHANTILLONNAGE SYSTÉMATIQUE 


L'échantillonnage systématique est un mode d'échantillonnage motivé 
surtout par des questions de commodité. Supposons que les patients d'une 
clinique médicale sont représentés dans un fichier alphabétique. On peut 
toujours indexer chaque fiche par un numéro qui la situe dans le fichier, et 
ensuite faire un tirage aléatoire des numéros. Une façon plus naturelle de 
procéder consiste à tirer les fiches à des intervalles réguliers. Par exemple, si 
l'on veut tirer n = 50 fiches d'une population qui en contient N = 10 000, on 
les tirera à des intervalles de 200 fiches. Plus précisément, la première est 
choisie au hasard parmi les 200 premières du fichier. Après elle, les 49 
autres suivent à des intervalles de 200. Si, par exemple, la première fiche est 
celle du rang 123, les fiches suivantes sont de rangs 323, 523, 723, 923, …, 
9 523, 9 723, 9 923. 


Ce mode d'échantillonnage a beaucoup d'attrait, indépendamment des 
questions de commodité. On sent qu'un échantillon tiré de cette façon a 


Échantillon 
Strate 1 2 3 4 5 6 7 8 9 10 
1 1 2 3 4 5 6 7 8 9 10 
2 11 12 13 14 15 16 17 18 19 20 
3 21 22 23 24 25 26 27 28 29 30 
4 31 32 33 34 35 36 37 38 39 40 
5 41 42 43 44. 45 46 47 48 49 50 


plus de chance de couvrir la population entière. Ceci est particulièrement 
vrai des expériences agricoles : en tirant une plante à chaque 10 rangées, 
disons, on s'assure que le champ entier soit représenté. Cet objectif, de 
couvrir toutes les parties d'une population, est parfois ce qu'on vise 
lorsqu'on stratifie. Il y a d'ailleurs un certain lien entre l'échantillonnage 
systématique et l'échantillonnage stratifié : supposons qu'on tire un 
échantillon systématique de taille nr = 5 d'une population de 50 éléments, 
numérotés de 1 à 50 dans le tableau ci-dessus. 


On prendra donc comme point de départ un nombre au hasard entre 1 et 
10, après quoi on tirera chaque 10-ième élément. Ainsi, si le nombre choisi 
est 4, l'échantillon sera formé des éléments 4, 14, 24, 34 et 44 : la quatrième 
colonne. Chacune des 10 colonnes est donc un des dix échantillons 
possibles. Si on considère les lignes comme des strates, l'échantillon 
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comprend un élément de chaque strate et donc il s'agit en un sens d'un 
échantillon stratifié. Mais contrairement à un échantillon stratifié, le tirage 
systématique restreint l'échantillon à une même colonne. Cette restriction 
peut rendre l'échantillon systématique moins efficace ou plus efficace que 
l'échantillon stratifié. 


On peut démontrer mathématiquement que, lorsque N est un multiple entier 
de n, la moyenne arithmétique X des données de l'échantillon est un 
estimateur sans biais de la moyenne LH de la population. Donc l'estimateur 
est identique à celui utilisé dans un échantillon aléatoire simple. 
Malheureusement, il n'existe pas d'estimateur de la variance de X ou de p, 


et donc aucune possibilité de déterminer des intervalles de confiance. 
L'échantillonnage systématique dépend de l'ordre dans lequel les éléments 
de la population sont disposés et l'effet de l'ordre peut être soit d'augmenter, 
soit de diminuer la précision de l'estimateur. D'une part, les échantillons 
systématiques peuvent améliorer la précision de l'estimateur grâce au fait 
qu'ils couvrent toutes les parties de la population. D'autre part, il est 
possible d'imaginer des données ayant une structure cyclique qui rend les 
estimations très peu précises. 


Remarque Certains analystes estiment l'écart-type de X ou de p comme si 


l'échantillon avait été tiré de façon purement aléatoire. Une façon de justifier 
cette approche est la suivante : la position des unités dans la population est 
elle-même aléatoire, dans le sens qu'elles auraient pu, sous l'effet du seul 
hasard, avoir été disposées autrement. Si l'on suppose que toutes les façons 
d'ordonner la population étaient a priori équiprobables, alors l'échantillon 
systématique est effectivement un échantillon aléatoire simple, prélevé en 
deux étapes : d'abord, les données de la population sont disposées dans un 
ordre aléatoire ; ensuite un échantillon systématique est tiré. Mais la première 
étape est effectuée par la nature, pas par le statisticien ; c'est ce fait curieux 
qui affaiblit l'argument : comment sait-on si les permutations des éléments de 
la population sont vraiment équiprobables, si on ne les effectue pas 
soi-même ? 
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10.6 


ÉCHANTILLONNAGE EN GRAPPES 


Supposons qu'on veuille échantillonner les élèves des écoles primaires d'une 
province pour tester leur connaissance des mathématiques. Un 
échantillonnage stratifié, avec les écoles comme strates, exigerait qu'on 
prélève un échantillon dans chacune des écoles, ce qui peut être 
malcommode et coûteux, surtout lorsque les écoles sont dispersées sur un 
grand territoire. Un échantillon aléatoire simple d'élèves est impossible sans 
une liste exhaustive des élèves, chose qu'on n'a pas toujours. Une liste 
d'écoles est facilement disponible, et peut être exploitée pour faire ce qu'on 
appelle un échantillonnage en grappes : on commence par faire un choix 
aléatoire d'écoles, qu'on appelle alors des grappes ou unités primaires ; et 
puis on choisit, à l'intérieur de chaque école, un échantillon d'élèves, qu'on 
appelle alors unités secondaires ou sous-unités. La situation est 
schématisée dans la figure 10.2. 


L'économie que permet de réaliser cette approche est claire. Un échantillon 
aléatoire simple, une fois choisi, est une liste de nr élèves qu'on doit aller 
chercher dans les écoles où ils se trouvent. Cela peut obliger à de nombreux 
voyages coûteux. L'échantillonnage en grappes permet de mieux rentabiliser 
ces voyages ; on peut tester plusieurs élèves dans chaque école à peu de frais 
supplémentaires. 


En général, on recourt à l'échantillonnage en grappes pour des raisons 
d'économie et de commodité et non pour des raisons de précision dans 
l'estimation. Contrairement à l'échantillonnage par strates, qui peut être 
choisi uniquement pour son efficacité statistique, l'échantillonnage en 
grappes n'est pas en général efficace. Précisons cette affirmation : pour un 
même nombre n d'unités secondaires (d'élèves), l'échantillonnage en grappes 
donne des variances plus grandes que l'échantillonnage aléatoire simple. 
Mais puisqu'il est plus économique, on peut au même coût obtenir un plus 
grand nombre d'unités secondaires ; et donc en définitive atteindre un degré 
de précision supérieur à celui que peut fournir un échantillon aléatoire 
simple de même coût. 


L'échantillonnage en grappes est complexe car il existe plusieurs façons de 
prélever les grappes, aucune nécessairement supérieure aux autres. Il est 
naturel au premier stade de prélever un échantillon aléatoire simple de 
grappes dans la population de grappes. Cette approche attache toutefois la 
même importance à toutes les grappes, les plus petites comme les plus 
grandes. Cela n'est pas le meilleur moyen d'améliorer la précision. 


338 Introduction à la statistique appliquée 


FIGURE 10.2 


Une autre façon de prélever les grappes consiste à les tirer successivement, 
avec remise, et avec probabilités proportionnelles aux tailles des grappes : 
les plus grandes grappes ont les plus fortes chances d'être tirées. C'est une 
façon de donner plus d'importance aux plus grandes grappes. 


Schéma d'un échantillonnage en grappes 


Échantillon d'écoles 


Plusieurs choix peuvent être exercés au deuxième stade aussi. On peut 
facilement imaginer de multiples combinaisons des différents modes 
d'échantillonnage. Les grappes sont elles-mêmes stratifiées, si l'on 
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commence par séparer les écoles en régions, ou en appartenance 
linguistique, ou selon d'autres catégories (privées, publiques, par exemple). 
Le tirage à l'intérieur d'une grappe peut être exhaustif (fous les élèves de 
l'école) ; ou aléatoire simple ; ou encore en grappes (les classes sont 
elles-mêmes des grappes à l'intérieur des grappes). 


L'estimation des paramètres et de leur variance dépend de manière cruciale 
du mode d'échantillonnage ; et se complique à mesure que se complique le 
plan d'échantillonnage. On ne peut pas analyser des données sans tenir 
compte des moyens utilisés pour les obtenir. Plusieurs erreurs d'estimation 
sont commises en traitant des données provenant d'un plan 
d'échantillonnage complexe comme si elles avaient été obtenues par 
échantillonnage aléatoire simple. Alors rien n'est plus garanti : les 
estimateurs usuels peuvent être biaisés, les variances peuvent être 
surestimées ou sous-estimées. 


RÉSUMÉ 


1. Soit X la moyenne d'un échantillon aléatoire simple tiré sans remise 
d'une population de taille N de variance 6°. L'estimateur X est sans 
biais et son écart-type est estimé par 


” n 
GO = — D 
X 


où 6, est la variance échantillonnale définie par 


ae SE x) 


n-1 


Lorsque les données sont dichotomiques (certaines valent 1, les autres O), la 
moyenne L est la proportion de « 1 », notée p ; l'estimateur X de p est noté 


b et o” prend la forme plus simple : 
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2. Un intervalle de confiance approximatif pour 1 (ou pour p) est donné 


e 6 : n - ô x n 
-c = -—<u<sX+e —.]1-— 
n\ N Jn\ NN 


où c, , est obtenu d'une table de la loi normale. 


par 


3. La moyenne 
u=Wu +Wu, +..+Wn, =)Wb 
d'une population stratifiée est estimé par 
= ne _ Ke 
D=WX +WX ,++W XX, =DWX.. 
Pour des données dichotomiques, 1 est noté p : 
K 
p=Wp+Wp,+.+Wer, = ZW, 
i=1 
et son estimateur est 
A A A A LS A 
p=Wp +W,p,+..+Wep, = D HD: 
i=l 


4. L'écart-type de cet estimateur est estimé par 


où (Ce est la variance du i-ième échantillon, donnée par [n, /(n, _1)]5 4, 
lorsque les données sont dichotomiques. 


5. L'allocation proportionnelle est la répartition de l'effectif total 
proportionnellement aux tailles des strates 


n.=nW. 


i i 
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L'allocation optimale est celle qui, pour un effectif total r, minimise la 


variance de ji. L'allocation proportionnelle est donnée par 


Donc, n. 


les n, proportionnels aux quantités W. 


Wo, 
Ê ———— h. 
i K 
] . W 6 . 
JA j 


L'échantillonnage systématique suppose une population de taille N 
dont les unités sont rangées dans un ordre déterminé. Pour prélever un 
échantillon de taille », un point de départ est tiré au hasard, après quoi 
on tire chaque k-ième unité, où 1/4 est la fraction d'échantillonnage. 


Lorsque les unités d'une population (les unités secondaires) sont 
groupées en « grappes » (les unités primaires), une façon de les 
échantillonner est de tirer d'abord les grappes ; et ensuite de prélever 
une partie ou toutes les unités secondaires contenues dans les grappes. 


EXERCICES 


1. 


Considérez la petite population de taille N = 6 dont les unités sont les 
suivantes : 


HSS Te) 
Calculez u et 6’. 


Dressez la liste des 15 échantillons de taille nr = 2 qu'on peut prélever 


de cette population et calculez X* et 6° pour chacun des 
échantillons. 


Présentez sous forme de tableau la fonction de masse de X. 


Vérifiez en utilisant la fonction de masse en c) que X est un 
estimateur sans biais pour hi. 


Calculez la variance de X en utilisant la fonction de masse en c). 
Calculez E(c°) et vérifiez que ce = (G°/n1-n/N), avec n= 2 et 


N = 6, est un estimateur sans biais pour la variance de X. 
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2. D'une population de N personnes on tire sans remise un échantillon de 
taille 25 afin d'estimer le revenu moyen LH de la population. On trouve 
X =32et6 = 12, en milliers de dollars. Vérifiez les données du tableau 
suivant, qui présente la demi-largeur d'un intervalle de confiance à 95 % 
pour H pour quelques valeurs de N. Faites un commentaire général sur 
l'effet d'un accroissement de N sur la précision d'un estimateur. 


N Demi-largeur de l'intervalle 
30 1,920 4 
40 2,880 6 
50 3,326 2 
150 4,294 1 
500 4,584 9 
10 000 4,698 1 
1 000 000 4,703 9 
Ce) 4,704 0 


3. D'une population formée de 3 strates de 1 670, 610 et 915 unités, on 
prélève un échantillon stratifié. On obtient les résultats suivants : 


Échantillon de la strate 1 : 
2, 3, 4, 2, 3, 4, 3, 2, 6,5, 3, 4, 2, 5, 6, 2, 3, 5, 4, 2, 3,8. 
n =22, ZX, =81 XX? -353 
Échantillon de la strate 2 : 
68, 98, 87, 56, 34, 33, 44, 28. 
n,=8, ZX, =448 ZX° = 29898 
Échantillon de la strate 3 : 
687, 675, 237, 99, 123, 456, 231, 324, 543, 654, 345, 234. 


n, =12, ZX, =4608 ZX? -2271312 
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a) Estimez la moyenne H de la population. 
b) Estimez le total rt de la population. 
c) Estimez l'écart-type de hi. 


d) Estimez l'écart-type de T. 
e) Déterminez un intervalle de confiance à 95 % pour nu. 


f) Déterminez un intervalle de confiance à 95 % pour +. 
g) Utilisez les données de l'échantillon pour estimer l'allocation optimale 
d'un échantillon de taille 42. (Vous supposerez ici que 6, est un 


estimateur adéquat de 6). 


h) Estimez ce qu'aurait été l'écart-type de H si l'allocation optimale 
avait été utilisée. 
Déterminez l'allocation optimale d'un échantillon de taille 100 pour 


estimer la moyenne d'une population dont les 3 strates contiennent 30, 
300, et 2 000 unités, et les écarts-types sont 150, 38, et 14. 


Une population est formée de 5 strates comprenant 235, 432, 1590, 2 
300, et 4 321 unités. Les écarts-types 6 sont 60, 36, 14, 12, et 10. 


a) Déterminez l'allocation optimale d'un échantillon de taille 180. 


b) Comparez l'écart-type de Hi pour l'allocation proportionnelle et 
l'allocation optimale. 

Les étudiants d'une université sont répartis en 4 facultés ayant 1 230, 

3 000, 2 500, et 8 000 étudiants, respectivement. On prélève un 


échantillon de 25, 61, 51 et 163 étudiants dans les 4 strates pour 
estimer la proportion p d'étudiants qui ont déjà utilisé la coopérative 


étudiante. On trouve que les nombres d'étudiants qui l'ont déjà utilisée 
dans les 4 échantillons sont 20, 43, 46, et 81, respectivement. 


a) Estimez la proportion p d'étudiants dans la population qui ont déjà 
utilisé la coop, ainsi que l'écart-type de l'estimateur. 


b) Déterminez un intervalle de confiance à 95 % pour p. 
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Estimez le nombre rt d'étudiants dans la population qui ont déjà 
utilisé la coopérative. 

Déterminez un intervalle de confiance à 95 % pour +. 

Utilisez l'estimation de p obtenue en a) pour estimer l'écart-type d'un 
estimateur basé sur un échantillon aléatoire simple de taille 300. 
Utilisez les résultats de ce sondage pour déterminer l'allocation 


optimale d'un éventuel deuxième sondage basé sur un échantillon de 
taille 300. Estimez la variance d'un estimateur p basé sur un 


échantillon de taille 300 réparti de façon optimale. 
Quelle devrait être la taille de ce prochain échantillon si l'on veut que 


la demi-largeur d'un intervalle de confiance à 95 % soit de 0,04 ? (Ne 
tenez pas compte des facteurs de correction dans vos calculs). 


7. Une population de 4 850 comptes est répartie selon le type de client : 
clients industriels, grossistes et détaillants. Les effectifs des strates sont 


N, 


= 50, N, = 800 et N, = 4 000, respectivement. Dans un échantillon 


stratifié de taille 85 on obtient les montants suivants : 


Strate 1 : Clients industriels 


50 212 30 215 12 564 36 598 37 222 


36 527 96 532 95 684 69 854 68 594 


X, =53400,20, 6, = 28272,321 


Strate 2 : Grossistes 


3 652 6 598 6 537 5 656 6 644 
6 563 6 521 6 549 6 598 6 537 
3 268 8 854 6 582 8 457 6 584 
9 658 6 532 9 564 9 856 6 598 
9 723 6 549 2147 3 345 5 465 


X, =6601,48, 6, = 2035,57 


Strate 3 : Détaillants 


325 
985 
985 
445 


762 


695 
658 
658 
323 
769 


658 
745 
321 
765 


126 


423 
698 
123 
139 


247 


X, =535,58, 6, = 275,656 8 


214 
365 
365 
239 
246 
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659 
256 
965 
432 
235 


a) Estimez le montant moyen des comptes. 


854 


985 


965 


871 


345 


632 
654 
856 
347 
345 


b) Estimez le montant total des comptes de la population. 


632 
965 
452 
138 
345 


345 


654 
965 
325 
325 
298 


c) Déterminez un intervalle de confiance à 95 % pour la valeur totale 
des comptes dans la population. 


d) Estimez l'allocation optimale en utilisant les données de l'échantillon. 


e) Estimez l'écart-type de Hi basé sur un échantillon de taille 85 avec 


allocation optimale. 


Considérez une population de 60 logements, de laquelle on prélève un 
échantillon systématique de taille 6 dans le but d'estimer le nombre 
moyen de personnes par logement. Les données pour la population 
entière sont présentées, ligne par ligne, dans le tableau suivant : 


NN OO À N © O1 


139 


© © NN BB © — 


21 
103 


© NN ON = Oo © BR 


3 4 
2 3 
4 2 
3 5 
2 7 
1 3 

15 24 

43 112 


OO OO OO © PB Co 


27 
131 


ND OO BB ND PB © 


21 
85 


a) Déterminez l'ensemble des 10 valeurs possibles de X, la moyenne 
d'un échantillon systématique de taille 6. 


b) Déterminez E (x }, et donc vérifiez que X est un estimateur sans 


biais. 


c) Déterminez Var(x L 
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9. 


10. 


Afin de prédire le volume de transport (en millions de tonnes kilo- 
métriques) qu'elle assurera l'an prochain, une compagnie de camionnage 
décide d'interroger 500 de ses expéditeurs réguliers. Les données des 
années précédentes permettent de classer les clients en quatre strates, 
selon leur importance. Les effectifs des strates et leurs variances sont : 


N:50 100 1000 3 000 
6,:38,0 11,0 5,0 2,5. 


Déterminez la meilleure façon de répartir les 500 observations et estimez 
la variance de H avec l'allocation optimale. 


Dans la bibliothèque d'une petite municipalité, les usagers sont fichés 
individuellement, mais les fiches correspondant à une même famille sont 
contigües et classées dans l'ordre suivant : mère, père, autres adultes s'il 
y a lieu, puis les enfants par ordre d'âge. On tire un échantillon de taille 
5 du fichier suivant (qui doit se lire ligne par ligne). La signification des 
symboles est la suivante : 


F : adulte de sexe féminin 
M : adulte de sexe masculin 
f : enfant de sexe féminin 


m : enfant de sexe masculin 


F M f f f F M f m PF M EF F m m m 
F M EF M EF M f m f F M f m PF M M f 
f F f f F M m f m EF M f f m PF M m 
m PF M m f F M f f m F M EF M EF M EF 
M f m f F m f F M F m f F M m m F 


Pour chacun des estimateurs suivants, déterminez la fonction de masse, 
l'espérance et l'écart-type. Vérifiez que les estimateurs sont sans biais. 


a) La proportion d'enfants dans l'échantillon. 
b) La proportion de personnes de sexe féminin dans l'échantillon. 
c) La proportion d'adultes de sexe féminin. 


d) Comparez chacun des écarts-types calculés ci-dessus avec l'écart- 
type correspondant à un échantillon aléatoire simple de taille 5. 
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11. Calculez l'écart-type des trois estimateurs traités à l'exercice précédent 
en supposant que la même population a été disposée de la façon 
suivante : 


F M m f F M f f F M F f F M m f F 
F M m f F M m f F M m f F M m f F 
F M m m F M m f F M m f F M m f M 
F M m f F M m f F M m f F M m f F 
F M f f F M m f F M m f F M m f F 


12. D'une population de 30 personnes on prélève un échantillon de taille 6 
pour estimer la proportion p de fumeurs. Soit p la proportion de 


fumeurs dans l'échantillon. Supposons que 12 personnes dans la 
population sont des fumeurs. 


a) Présentez sous forme de tableau la fonction de masse de p 


(suggestion : utilisez la loi hypergéométrique). 


b) Vérifiez à l'aide de ce tableau que p est un estimateur sans biais 
de p. 


c) Calculez GS en utilisant le même tableau. 


d) Déterminez la fonction de masse de 8 =(p(1-p)}/(n-1){1-n/N) et 


A2 . suite 2 
montrez que 6 5 est un estimateur sans biais de o 5 
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Introduction On appelle série chronologique (ou série temporelle) une suite 


d'observations x,,x,,...,x, Correspondant à des mesures successives 


effectuées sur un même phénomène. Le nombre T indique la longueur de la 
série et tient essentiellement le même rôle que la taille # d'un échantillon 
ordinaire. La mesure prise au temps f est notée x. 


Les températures enregistrées à chaque heure à une certaine station 
météorologique constituent un bon exemple de série chronologique. Ces 
données ne peuvent être traitées comme un échantillon simple car elles ne 
sont pas indépendantes : les observations successives sont fortement 
corrélées et l'ordre dans lequel elles se présentent doit être tenu en compte. 


Le nombre d'automobiles vendues par un certain détaillant, au cours de 
chacune des 100 dernières semaines, est un autre exemple. Comment peut- 
on utiliser ces données pour prédire convenablement combien d'automobiles 
seront vendues durant les quelques prochaines semaines ? Le volume 
général des ventes est-il en progression ? Y a-t-il un phénomène saisonnier 
suffisamment important pour qu'on doive en tenir compte ? 


Le monde socio-économique regorge de telles séries : qu'on songe, par 
exemple, aux variations du coût de la vie, des taux d'inflation ou de chômage 
qui font constamment la manchette au moindre soubresaut... 


Dans les trois premières sections de ce chapitre nous adoptons une 
approche purement descriptive dans laquelle le hasard ne jouera pas grand 
rôle. Nous y verrons comment lisser le graphique d'une série chronologique 
pour le débarrasser de fluctuations locales sans signification (qui peuvent 
être assimilées à des variations accidentelles ou à des erreurs de mesure), 
pour en dégager une courbe plus douce qui décrit beaucoup mieux l'allure 
générale du phénomène. Nous verrons aussi comment transformer une série 
chronologique, comment la combiner avec une autre pour mieux faire 
ressortir tel ou tel autre aspect de sa structure. Nous aborderons enfin 
certains problèmes de prédiction, d'extrapolation. 


Dans les deux dernières sections, nous introduisons quelques modèles plus 
articulés où les lois du hasard sont mises à profit pour aller un peu plus loin 
qu'une simple description. 
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11.1 TECHNIQUES DE LISSAGE 


Lorsqu'une série chronologique est illustrée sous forme graphique, elle 
présente souvent un comportement général relativement doux sur lequel est 
superposé un comportement local plutôt cahoteux qu'il serait souhaitable 
d'aplanir. On voudrait pouvoir promener sur le graphique un « fer à repasser 
stochastique » qui en effacerait toutes les aspérités accidentelles et ne 
laisserait subsister que les amples fluctuations générales qui, seules, sont 
significatives. Un exemple servira à illustrer cette situation. 


EXEMPLE Entre 7 h 00 et 9 h O0, 25 autobus sont arrivés successivement en bout de 
ligne. Le tableau qui suit donne le nombre de passagers que transportait 
chacun de ces autobus. 


TABLEAU 11.1 Heure d'arrivée de 25 autobus et nombre X de passagers. 


{ Heure d'arrivée X, { Heure d'arrivée X, 
1 7h00 15 14 8h05 43 
2 7h05 22 15 8h10 57 
3 7h10 14 16 8h15 40 
4 7h15 25 17 8 h 20 49 
5 7h20 30 18 8h25 54 
6 7h25 22 19 8 h 30 27 
7 7h30 37 20 8h35 46 
8 7h35 32 21 8h40 43 
9 7h40 47 22 8h45 34 
10 7h45 38 23 8h 50 23 
11 7h50 34 24 8h55 37 
12 7h55 51 25 9 h 00 24 


13 8 h 00 32 


FIGURE 11.1 
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Cette série chronologique de longueur T = 25 est illustrée par le graphique 
dans la figure 11.1. 


Malgré un comportement local en « dents de scie », on peut déjà observer 
que, grosso modo, les données ont d'abord tendance à croître puis, après un 
certain temps, elles se mettent à décroître. C'est cette tendance douce que 
nous souhaitons isoler, extraire des brusques irrégularités locales. + 


On pourrait, bien sûr, faire passer « à l'oeil » une courbe douce parmi les 
points du graphique mais ce procédé intuitif et artisanal est peu satisfaisant. 
Mieux vaut calculer ces nouvelles valeurs par lesquelles passera la courbe 
lisse, épurée de ses dents de scie. 


Moyenne mobile Une façon simple et naturelle de procéder au lissage d'une 
série chronologique trop cahoteuse consiste à remplacer chaque observation 
x, de la série par une nouvelle valeur, notée x, qui est la moyenne de 


plusieurs observations voisines. Nous savons que la moyenne de plusieurs 
observations est beaucoup plus stable qu'une observation individuelle. Cette 
nouvelle série x,,x,,..., x, porte le nom de moyenne mobile. 


Nombre de passagers dans 25 autobus successifs. 


X 


60 
50 
40 
30 
20 


10 
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EXEMPLE 2 


Par exemple, on peut définir x, comme étant la moyenne des 3 observations 


consécutives x,,,x, et x,,. Pour un lissage encore plus vigoureux, on 


1° "4 1° 
calculera la moyenne d'un nombre encore plus grand d'observations 
consécutives. On aura alors x, = 16, RE ET +x.) ou encore 


x, =!(x +X OHX OO +X +X  +X  +X 
1-3 1-2 t-1 t t+1 1+2 


8 =3 ) selon qu'on convient d'utiliser une 


1+3 


moyenne mobile portant sur 5 ou sur 7 observations consécutives. 


En général, on convient donc d'un certain rayon r (par exemple, on peut 
prendre r = 2 ou r = 3) puis on remplace chaque x, par la moyenne x, des 


2r + 1 observations consécutives x, à x, .On peut se représenter le rayon r 


comme étant la demi-largeur d'une « fenêtre » imaginaire qui se promène tout 
le long de la série et qui, lorsqu'elle est centrée en t, ne laisse voir que les 
observations x,, à x, qui participeront au calcul de x,. Plus la fenêtre est 


large, plus nombreuses seront les observations utilisées dans le calcul de x, 


et plus vigoureux sera le lissage des dents de scie. Il faut toutefois éviter de 
prendre une fenêtre trop large (un r trop grand) qui nous ferait tenir compte 
d'observations très éloignées (dans le temps) de l'observation centrale x, et 


pour lesquelles la courbe douce peut fort bien être beaucoup plus haute ou 
beaucoup plus basse que ce qu'elle vaut au centre de la fenêtre. 


Deux objectifs sont en conflit : stabilité et sensibilité. Plus la fenêtre est 
large, plus grand est le risque d'effacer, en même temps que les accidents 
locaux qu'on souhaite éliminer, des variations réelles et significatives de la 
courbe douce qu'on cherche à isoler. 


Au tout début de la série, de même qu'à sa toute fin, on ne dispose pas de 
toutes les informations requises ; la fenêtre déborde en partie sur des 
valeurs inexistantes ou non observées correspondant à des valeurs de t 
inférieures à 1 ou supérieures à T. On conviendra alors de définir x, comme 


étant la moyenne d'un moins grand nombre d'observations, c'est-à-dire 
uniquement de celles qui paraissent dans la fenêtre. 


Appliquée aux 25 données du tableau 11.1, une moyenne mobile de rayon 
r = 2 fournit la série lissée suivante : 
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15+22+14)/3 =17,0 


X, — 


( 
x, =(15+22+14+25)/4=19,0 
—\ V 
(15+22+14+25+30)/5 = 21,2 
( 


X. = 


X. = 


22+14+25+30+22)/5 + 22,6 


= (46+43+34+23+37)/5 = 36,6 


( 
= 
( 
( 


43+34+23+37+24)/5 = 32,2 
34+23+37+24)/4= 29,5 


4 — 
x, =(23+37+24)/3 = 28,0. 


Sauf les deux premières et les deux dernières, chaque valeur x, de la série 


lissée est la moyenne de 2r + 1 = 5 termes consécutifs de la série originale : 


5 Huy toX, 42 %,s POUT = 1 où 2, dé même que pour 1 = 24 où 25, la 


moyenne n'a porté que sur les 3 ou 4 termes qui étaient visibles dans la 
fenêtre mobile. 


La figure 11.2, présentée plus loin, illustre le lissage obtenu. + 


En général, il vaut mieux définir x, comme étant une moyenne pondérée des 


2r + 1 valeurs apparaissant dans la fenêtre, et qui accorde plus de poids aux 
observations situées au centre qu'à celles qui sont près des bords. En 
procédant ainsi, chaque nouvelle observation qui entre dans la fenêtre (ou 
qui en sort) le fait d'une façon moins brutale et n'influence que 
graduellement la valeur de la moyenne mobile. 


En plus de convenir d'un rayon r, on choisira donc aussi des poids 
c C_,,C6:€,,...,c, qui fourniront la pondération désirée. Par symétrie, on 


Ep PTS DL TD AT 2° 


conviendra de prendre € , =c,,c = 6 ar C 


—r+l r-1? 


 =c,. En choisissant ces c, 


de telle sorte qu'ils décroissent régulièrement de c, à c,, on obtiendra la 
moyenne pondérée souhaitée qui accorde plus de poids aux observations 
centrales qu'à celles situées en bordure de la fenêtre. Il ne reste plus qu'à 
calculer, pour chaque valeur de t, 


x (Sex. )/(£e.) 
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EXEMPLE 3 


La formule qui précède n'est évidemment applicable que pour des valeurs de 
t situées suffisamment loin du début ou de la fin de la série. Pour les toutes 
premières valeurs de t (pour t < n de même que pour les dernières (pour t > 
T- n, cette formule réclame les valeurs d'observations inaccessibles qui 
précèdent x, ou qui suivent x,. Ces observations n'étant pas disponibles, on 


ne peut en tenir compte et, dans le calcul de x,, on écartera, tant au 


numérateur qu'au dénominateur, les valeurs de i pour lesquelles l'indice t + i 
est inférieur à 1 ou supérieur à T. 


Si tous les poids € ,,c ,.,,,..,C,,c,,..,c.,,c, sont égaux, on obtient une 
moyenne ordinaire. En prenant des c, qui croissent de cc à c, puis qui 
i =r 0 
décroissent symétriquement de c, à c,, on obtient un lissage plus doux. On 
peut prendre, par exemple, des poids c, en progression triangulaire, avec 


c,.=c,=1,c,, =c,,=2,..,c, =c, =r,c, =r+1. Avec r = 4, on aurait alors 


=r r+1 rl 


c,=c, =l,c 


” =Cc,=2,c,=c,=3,c, =c =4etc, =5. 


3 2 2 


Mieux encore, on peut choisir les c, en utilisant les coefficients du binôme 


de Newton dont la table paraît à la page 397. On prend alors 


2r 
C:= pour iallant de-rà+r. 
r +1 


Par exemple, si r = 2,les c, valent respectivement 1, 4, 6, 4 et 1. 


Appliquée aux 25 données du tableau 11.1, une moyenne mobile de rayon 
r = 2, avec poids binomiaux (1, 4, 6, 4 et 1) fournit la série lissée suivante : 
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X._ = 


15x6+22x4+14x1)/(6+4+1)=17,5 
15x4+22x6+14x4+25x1)/(4+6+4+1)=18,2 


22x1+14x4+25x6+30x4+22x1)/(1+4+6+4+1)= 23,1 


X._= 


( 
( 

x, =(15x1+22x4+14x6+25x4+30x1)/(1+4+6+4+1)=19,8 
( 


46x1+43x4+34x6+23x4+37x1)/(1+4+6+4+1)= 34,4 


34x1+23x4+37x6+24x4)/(1+4+6+4)= 29,6 


Y = 


( 

x, =(43x1+34x4+23x6+37x4+24x1)/(1+4+6+4+1)= 30,6 
( 
( 


23x1+37x4+24x6)/(1+4+6)= 28,6. 


% — 
+ 


Poursuivis pour la série entière, les calculs développés dans les exemples 2 
et 3 mènent aux valeurs lissées présentées dans le tableau 11.2. 


On constate (voir figures 11.2 et 11.3) que le second lissage, celui qui utilise 
des poids binomiaux, est plus lisse, plus doux que le premier. 


Lissage exponentiel Une autre technique de lissage est fréquemment 
employée lorsque les données sont observées une à une et qu'on a besoin, 
dès l'observation de x,, de pouvoir calculer la valeur x, de la série lissée et 


de fournir immédiatement une estimation *. pour la prochaine valeur qui 


t+1 


n'a pas encore été observée. 


On ne peut évidemment pas utiliser les valeurs x,,,x,,,,..., qui ne sont pas 


encore disponibles. Seules les valeurs de x,,x,,,x,,,.., sont utilisables 
dans l'expression de x. En fait, nous définirons x, en fonction de x, (la 
dernière valeur observée) et de x, (la valeur lissée au temps précédent). 


Nous poserons 


x, =0x, +(1-0 )x,, 


t 


où le paramètre 0, choisi entre O et 1, mesure l'importance de la 
contribution de la dernière observation x, dans le calcul de la valeur lissée 


x,. Si 0 est choisi près de 1, x, sera pratiquement égal à x, et le lissage 
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TABLEAU 112 Moyenne mobile simple et moyenne mobile avec poids binomiaux 
(toutes deux avec r = 2) lissant les données du tableau 11.1 


X, X, 
t x, (poids égaux) (poids binomiaux) 
1 15 17,0 17,5 
2 22 19,0 18,2 
3 14 21,2 19,8 
4 25 22,6 23,1 
5 30 25,6 26,2 
6 22 29,2 28,6 
7 37 33,6 32,2 
8 32 35,2 36,8 
9 47 37,6 39,6 
10 38 40,4 39,7 
11 34 40,4 39,9 
12 51 39,6 40,7 
13 32 43,4 41,2 
14 43 44,6 44,1 
15 57 44,2 47,2 
16 40 48,6 47,6 
17 49 45,4 47,1 
18 54 43,2 44,6 
19 27 43,8 40,9 
20 46 40,8 40,3 
21 43 34,6 39,3 
22 34 36,6 34,4 
23 23 32,2 30,6 
24 37 29,5 29,6 
25 24 28,0 28,6 


sera minime. Au contraire, si 0 est choisi près de 0, x, sera pratiquement 


égal à x, et la dernière observation x, n'influencera que très peu la valeur 


du nouveau x. 


Encore une fois, il y a conflit entre les vœux opposés de stabilité et de 
sensibilité. Si on a l'impression que la courbe « idéale » (celle qu'on cherche à 
déterminer en calculant les x) ne varie que très lentement, on peut se 


permettre un lissage vigoureux (avec 6 petit). Si, au contraire, cette courbe 
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FIGURE 11.2 Moyenne mobile simple (avec r = 2) lissant la série illustrée à la figure 11.1 


x 
60 


. RS — 


EE RS à 


FIGURE 113 Moyenne mobile avec poids binomiaux (r =2, poids 1, 4, 6, 4, 1) lissant la série illustrée à la 
figure 11.1 


idéale est susceptible de brusques soubresauts, mieux vaut augmenter la 
sensibilité du lissage en prenant un 0 plus grand. La quantité 1 - 8 mesure 
l'inertie de la suite des x,, leur résistance aux changements apportés par les 


x, successifs. 
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Remarquons que chaque nouvelle valeur lissée x,, qui a été obtenue en 
fonction de x, et de x,,, peut aussi être exprimée en fonction des dernières 


observations x ,x. ,X etc. En effet, puisque x,,, est lui-même de la 


EPA 2 TT EE2 ? 1? 


forme Ex, +(1-0)x,, où x, peut, à son tour, être remplacé par 


Ex, +(1-0 )x,,, etc., on obtient successivement 
x, =6x, +(1-0)x, 

=6x, +(1-0 J(Ex,, +(1-0)x,) 

= 6x, +0(1-0 )}x,, +(1-8) x,, 

6x, +0(1-6)x,, +(1-0) (8x, , +(1-6)x.) 


=@x, +8(1-08 }x,. +0(1-8)° x, +8(1-8) x. +. 


Chaque nouvelle valeur lissée x est donc une moyenne pondérée de toutes 


les observations précédentes (x ,x_.,x 


»»X,15%,, €tc.). Les poids utilisés 
décroissent de façon exponentielle, d'où le nom de cette technique de 
lissage : lissage exponentiel. Si 6 est près de 1, le terme 1 - 6 sera petit et la 


contribution des vieilles observations sera négligeable. 


En début de lissage, une difficulté se présente : quelle valeur doit-on donner 


à x, ? On ne peut utiliser la formule x, =6x, + (1-0 x, puisqu'on ne dispose 
d'aucune valeur pour x,. En pratique, nous ferons comme si les valeurs non 


observées (ou imaginaires) x,,x ,x,, etc. étaient toutes égales à la 


première observation x. Cette convention nous donne une valeur 


raisonnable pour x, ; nous prendrons donc x, =x,, ce qui donne aussi 


1 2 
x, = x,. Remarquons que le choix d'une valeur ou d'une autre pour x, a peu 
de conséquences : à moins que 8 soit vraiment très petit, la valeur initiale 
adoptée en début de lissage est bien vite effacée, noyée dans les observations 
qui suivent et son effet décroît exponentiellement au fur et à mesure que 


s'accumulent les observations nouvelles. 


La suite des valeurs lissées successives nous permet enfin d'effectuer une 


prédiction concernant la prochaine observation x, ou, plus précisément, 


concernant la prochaine valeur lissée x,,. La façon la plus naturelle de 


1° 


EXEMPLE 4 


11 Séries chronologiques 359 


procéder est de supposer que, durant le prochain intervalle de temps (de tàt 
+ 1), la courbe douce continuera à monter ou à descendre de la même façon 
que ce qu'elle a fait durant le dernier intervalle de temps (de t - 1 à 4. On 
posera donc 


Remarque Cette formule, exprimée en fonction de x, et de x,, peut aussi être 


exprimée en fonction de x, et de x,. En effet, puisque x, =6x, + (1-0 ER ;,ona 


X 1 = (x, —6x, )/(1-6). Substituant cette expression dans la formule originale 


on obtient, après quelques manipulations algébriques, 
Ai =X, +(x, x p/(1-06). 


Cette nouvelle formulation de X,, permet de voir que la prévision x,, sera 


t+1 
supérieure (ou inférieure) à la dernière valeur lissée (x,) en proportion de 
l'écart x, -x, entre la dernière observation et la valeur lissée correspondante, 


le facteur de proportionnalité étant 0 /(1-8 ). 


Durant ses 29 premières années d'existence (de 1969 à 1997) l'équipe de 
baseball « Les Expos de Montréal » a obtenu les résultats (proportions de 
victoires) qui paraissent à la troisième colonne du tableau 11.3. Les deux 
autres colonnes du même tableau donnent les valeurs obtenues en 
appliquant à cette série un lissage exponentiel où le paramètre 0 est fixé à 


Y, ou à %. 


Avec 0 =-, par exemple, on obtient 


L 
2 


x, =0x, +(1-0 )x, =1x0,451+1x0,321 = 0,386 


2 


+(1-0 )}x, = Lx0,441+ Lx 0,386 = 0,414 


2, 
etc. 


Le tableau 11.3 donne aussi, pour chacun de ces deux lissages, la 
«prédiction » X,, obtenue en appliquant la formule 2x,, -x,. Les figures 


11.4 et 11.5 illustrent ces résultats d'une façon graphique. + 
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On observe que le second lissage est plus doux que le premier. Par contre, il 
a plus d'inertie et prend plus de temps à s'ajuster aux changements qui 
surviennent dans la série originale. 


Remarque En 1998 les « Expos » ont obtenu une moyenne de 0,401 (65 
victoires et 97 défaites), ce qui est sensiblement inférieurs aux prédictions 
fournies par ces deux lissages exponentiels. 


TABLEAU 113  Proportions de victoires obtenues par les « Expos » de 1969 à 1988. Deux lissages exponentiels 


et prédictions pour 1989. 
lissage lissage 
Année t Xt exponentiel exponentiel 
1 1 
avec 0 = avec 0 =- 
1969 1 0,321 0,321 0,321 
1970 2 0,451 0,386 0,364 
1971 3 0,441 0,414 0,390 
1972 4 0,449 0,431 0,410 
1973 5 0,488 0,460 0,436 
1974 6 0,491 0,475 0,454 
1975 7 0,463 0,469 0,457 
1976 8 0,340 0,405 0,418 
1977 9 0,463 0,434 0,433 
1978 10 0,469 0,451 0,445 
1979 11 0,594 0,523 0,495 
1980 12 0,556 0,539 0,515 
1981 13 0,556 0,548 0,529 
1982 14 0,531 0,539 0,529 
1983 15 0,506 0,523 0,522 
1984 16 0,484 0,503 0,509 
1985 17 0,522 0,513 0,513 
1986 18 0,484 0,498 0,504 
1987 19 0,562 0,530 0.523 
1988 20 0,500 0,515 0,515 
1989 21 0,500 0,508 0,510 
1990 22 0,525 0,516 0,515 
1991 23 0,441 0,479 0,490 
1992 24 0,537 0,508 0,506 
1993 25 0,580 0,544 0,531 
1994 26 0,649 0,592 0,567 
1995 27 0,458 0,525 0,531 
1996 28 0,543 0,534 0,535 
1997 29 0,481 0,507 0,517 


Prédictions pour 1998 0,480 0,499 
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FIGURE 11.4 Proportions de victoires obtenues par les « Expos » de 1969 à 1988. Lissage exponentiel avec Ô = : et prédiction pour 1989. 
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FIGURE 11.5 Proportions de victoires obtenues par les « Expos » de 1969 à 1988. Lissage exponentiel avec Ô = + et prédiction pour 1989. 
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11.2 


TABLEAU 11.4 


NOMBRES INDICES 


En 1950, la production canadienne de cuivre a été de 239 685 tonnes. En 
1985, elle a été de 738 637 tonnes. La comparaison de ces deux grandeurs 
est aisée : les mines canadiennes ont produit 3,08 fois plus de cuivre en 
1985 qu'en 1950. Les unités n'ont pas changé : une tonne reste une tonne, 
quel que soit le moment où la mesure est effectuée. 


En 1969, le salaire annuel moyen, au Canada, pour les hommes, était de 
4 746 $. En 1986, ce même salaire moyen était de 23 855 $. Peut-on dire 
que le travailleur de 1986 était 5,03 fois plus riche que le travailleur de 1969 
? Ce serait vrai si le dollar de 1986 avait le même pouvoir d'achat que celui 
de 1969, mais tel n'est pas le cas. Pour comparer les valeurs réelles de ces 
deux revenus, il faut pouvoir les exprimer en unités équivalentes, en dollars 
de la même année. 


Indice des prix à la consommation, Canada (1981 = 100) 


Année Indice Année Indice Année Indice Année Indice 
1950 25,2 1963 32,6 1976 62,9 1989 150,9 
1951 27,9 1964 33,2 1977 67,9 1990 158,2 
1952 28,5 1965 34,0 1978 73,9 1991 167,0 
1953 28,3 1966 35,2 1979 80,7 1992 169,6 
1954 28,5 1967 36,5 1980 88,9 1993 172,6 
1955 28,5 1968 38,0 1981 100,0 1994 173,0 
1956 28,9 1969 39,7 1982 110,8 1995 176,7 
1957 29,8 1970 41,0 1983 117,2 1996 179,6 
1958 30,6 1971 42,2 1984 122,3 1997 182,5 
1959 31,0 1972 44,2 1985 127,2 
1960 31,4 1973 47,6 1986 132,4 
1961 31,7 1974 52,8 1987 138,2 
1962 32,0 1975 58,5 1988 143,8 


SOURCE : Statistique Canada 


Statistique Canada évalue et publie chaque année un indice des prix à la 
consommation (aussi appelé indice du coût de la vie) qui permet d'effectuer de 
telles comparaisons. Sans entrer dans les détails techniques concernant la 
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façon précise dont cet indice est calculé, disons simplement qu'on imagine 
un « panier de provision typique » qui tient compte des principaux champs 
de consommation (alimentation, habitation, vêtements, etc.) D'une année à 
l'autre, le montant qu'il faut débourser pour acquérir ce panier de provisions 
théorique peut être mesuré. Le tableau 11.4 donne les valeurs de cet indice 
pour les années 1950 à 1987. Par convention on a fixé à 100 la valeur de 
l'indice pour l'année 1981. 


Les indices présentés dans le tableau 11.4 peuvent être représentés comme 
étant le prix qu'il fallait payer, chaque année, pour acquérir ce qui coûtait 
100 $ en 1981. On voit, par exemple, qu'en 1987 il fallait débourser 138,2 $ 
alors qu'en 1950 on pouvait obtenir la « même chose » pour seulement 25,2 
$. Ce dernier énoncé doit cependant être reçu avec circonspection : combien 
coûtait un magnétoscope ou un ordinateur domestique en 1950 ? en 1850 ? 
Le panier de provision typique qui sert à calculer cet indice porte plutôt sur 
des biens « intemporels », tels l'alimentation et l'habitation, mais même pour 
ces biens fondamentaux on ne peut être tout à fait à l'abri d'un certain 
décalage technologique (combien coûtaient les fraises, en 1900, au milieu de 
l'hiver ?) 


Il va de soi que le choix de 1981 comme année de référence (pour laquelle 
l'indice vaut 100) est purement arbitraire. Une autre année de référence 
ferait tout aussi bien l'affaire. Les données du tableau 11.4 peuvent être 
facilement reformulées de telle sorte que l'année de référence soit n'importe 
quelle autre. Par exemple, si l'on veut que l'indice 100 corresponde à l'année 
1985 (pour lequel le tableau 11.4 donne la valeur 127,2), il suffit de diviser 
tous les indices du tableau 11.4 par 1,272. L'indice pour 1950, par exemple, 
deviendra alors 25,2/1,272 = 19,8. 


Nous pouvons maintenant revenir à la question posée au début de cette 
section : comment se comparent les revenus des travailleurs de 1986 à ceux 
de 1969 ? La comparaison pourra se faire en exprimant chacun des revenus 
(4 746 $ en 1969 et 23 855 $ en 1986) en dollars d'une même année, par 
exemple, en dollars de 1981. 


Le tableau 11.4 nous indique que 39,7 $ de 1969 ont le même pouvoir 
d'achat que 100 $ de 1981. On trouve que 4 746 $ de 1969 ont le même 
pouvoir d'achat que 4 746 x ce = 11 955 $ de 1981. De la même façon, 


39, 


23 855 $ de 1986 ont le même pouvoir d'achat que 23 855 x Hs = 18017 $ 
de 1981. 
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EXEMPLE 5 


Étant maintenant tous deux exprimés en unités équivalentes (en dollars de 


1981), les deux revenus peuvent être comparés d'une façon équitable. On 
18 017 


trouve que le travailleur de 1986 est == 


= 1,51 fois plus riche que le 


travailleur de 1969. Ce rapport de 1,51 est beaucoup plus réaliste que la 
valeur 5,03 obtenue en calculant naïvement le quotient des deux revenus 
sans tenir compte du fait que la valeur du dollar avait considérablement 
changé de 1969 à 1986. 

L'indice des prix à la consommation établi par Statistique Canada et 
présenté dans le tableau 11.4 est un indice composé fondé sur plusieurs 
facteurs (alimentation, habitation, etc.) Pour certains de ces facteurs, les prix 
peuvent varier plus rapidement que pour d'autres. Le tableau 11.5 présente 
les indices des prix à la consommation qui s'appliquent spécifiquement à 
chacun des types de produits ou services. 


En 1960 une famille dépensait 26 $ par semaine pour la nourriture et 29 $ 
par semaine pour le logement. Combien coûtaient, en 1987, une quantité 
comparable de nourriture et un logement analogue ? 


Pour la nourriture, les indices sont 25,8 (pour 1960) et 132,4 (pour 1987). 
Une dépense de 26 $ en 1960 correspond donc, en 1987, à une dépense de 
26 $ x 132,4/25,8 = 133 $. 

Pour le logement, ce qui coûtait 29 $ en 1960 (où l'indice est 32,2) coûtait en 
1987 (où l'indice est 138,3) un montant de 29 $ x 138,3/32,2 = 125 $. La 
famille de 1960 dépensait plus pour le logement que pour la nourriture ; 
celle de 1987, pour des biens analogues, dépense plus pour la nourriture 
que pour le logement. + 
L'information contenue dans le tableau 11.4 peut être présentée d'une autre 
façon. En calculant le quotient des indices des prix à la consommation pour 
deux années consécutives, on obtient une mesure de l'augmentation du coût 
de la vie durant cette période. En exprimant cette augmentation en 
pourcentage, on obtient ce qu'on appelle le taux d'inflation. Par exemple, 
l'indice général du coût de la vie était de 117,2 en 1983 et 122,3 en 1984. Le 
quotient 122,3/117,2 = 1,044 nous indique que le taux d'inflation a été de 
4,4 % en 1984. Ce qui coûtait un certain prix en 1983 coûtait environ 4,4 % 
de plus en 1984. 

De la même façon qu'on vient de déterminer le taux (général) d'inflation à 
partir de l'indice (général) des prix à la consommation, on peut déterminer, 
en remplaçant les données du tableau 11.4 par celles du tableau 11.5, le 
taux spécifique d'inflation qui s'applique à tel ou tel autre secteur de 
consommation. Par exemple, pour l'année 1984 (où le taux général était de 
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4,4 %), on obtient que, pour l'alimentation seulement, le taux d'inflation a 
été de (117,4/111,2) - 1 = 0,056 = 5,6 %. Pour les vêtements, le taux 
spécifique d'inflation, pour la même année, a été beaucoup plus faible, soit 
(112,5/109,8) - 1 = 2,5 %. 


TABLEAU 11.5 Indice des prix à la consommation, selon la catégorie (1981 = 100) 


Année Indice Alimentation Habitation Vêtements Transports Hygiène Tabac et 
général et Santé Alcool 
1950 25,2 21,6 25,3 35,9 24,3 20,8 32,8 
1955 28,5 23,7 29,7 38,9 27,3 25,9 34,3 
1960 31,4 25,8 32,2 40,0 32,3 31,6 37,0 
1965 34,0 28,7 34,2 43,7 34,0 35,9 39,1 
1970 41,0 34,1 42,3 51,5 40,4 44,3 47,0 
1975 58,5 55,8 58,9 65,4 54,4 60,2 59,9 
1976 62,9 57,3 65,4 69,0 60,3 65,3 64,2 
1977 67,9 62,0 71,5 73,7 64,6 70,2 68,7 
1978 73,9 71,6 76,9 76,5 68,3 75,2 74,3 
1979 80,7 81,0 82,3 83,6 74,9 82,0 79,6 
1980 88,9 89,8 89,0 93,4 84,5 90,2 88,6 
1981 100,0 100,0 100,0 100,0 100,0 100,0 100,0 
1982 110,8 107,2 112,5 105,6 114,1 110,6 115,5 
1983 117,2 111,2 120,2 109,8 119,8 118,2 130,0 
1984 122,3 117,4 124,7 112,5 124,8 122,8 140,6 
1985 127,2 120,8 129,0 115,6 130,8 127,2 154,0 
1986 132,4 126,8 132,9 118,8 135,0 132,6 172,3 
1987 138,2 132,4 138,3 123,8 139,9 139,2 183,9 
1988 143,8 135,9 144,3 130,3 142,5 145,3 197,6 
1989 150,9 141,0 151,9 135,5 149,9 151,6 216,0 
1990 158,2 146,8 158,8 139,3 158,3 159,0 234,9 
1991 167,0 153,9 165,7 152,4 161,1 170,2 275,1 
1992 169,6 153,2 168,0 153,8 164,4 174,0 291,4 
1993 172,6 155,8 170,2 155,3 169,7 178,7 296,1 
1994 173,0 156,5 170,9 156,6 177,2 180,3 247,7 
1995 176,7 160,1 173,4 156,4 186,4 180,1 247,4 
1996 179,6 162,3 174,8 155,9 193,7 181,1 252,4 
1997 182,5 164,9 175,8 157,9 199,7 184,3 260,3 


SOURCE : Statistique Canada 
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TABLEAU 11.6 Taux général d'inflation au Canada, 1950-1987 


Année Taux Année Taux Année Taux Année Taux 
(en %) (en %) (en) (en) 
1950 3,0 1962 1,2 1974 10,9 1986 4,1 
1951 10,6 1963 1,7 1975 10,8 1987 44 
1952 2,3 1964 1,8 1976 7,5 1988 4,1 
1953 -0,8 1965 2,4 1977 8,0 1989 4,9 
1954 0,6 1966 3,7 1978 8,9 1990 4,8 
1955 0,0 1967 3,6 1979 9,2 1991 5,6 
1956 1,5 1968 4,0 1980 10,2 1992 1,6 
1957 3,1 1969 4,5 1981 12,5 1993 1,8 
1958 2,5 1970 3,4 1982 10,8 1994 0,2 
1959 1,1 1971 2,8 1983 5,8 1995 2,1 
1960 1,3 1972 4,8 1984 4,4 1996 1,6 
1961 1,0 1973 7,6 1985 4,0 1997 1,6 


SOURCE Statistique Canada 


FIGURE 116 Taux général d'inflation, au Canada, de 1950 à 1987 
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EXEMPLE 6 


DÉSAISONNALISATION 


Il arrive fréquemment qu'une série chronologique présente des fluctuations 
régulières et prévisibles induites par un cycle naturel qui agit directement 
sur le phénomène mesuré. L'exemple le plus éloquent est sans doute celui de 
la température. Si l'on mesurait, à chaque heure et durant plusieurs années, 
la température qu'il fait en un point donné, on observerait deux cycles : un 
cycle annuel (il fait plus chaud l'été que l'hiver) et un cycle journalier (il fait 
plus chaud le jour que la nuit). Sur ces deux cycles réguliers se superposent 
des variations plus capricieuses, moins systématiques et qu'on ne peut 
prévoir à long terme. Une série chronologique est désaisonnalisée quand on 
a soustrait à chaque terme de la série la quantité correspondant à ces effets 
périodiques. 


Supposons que, dans une certaine région, le taux de chômage augmente 
habituellement de 3 % en janvier (par rapport à la moyenne annuelle) et 
diminue de 2 % en juillet. Peut-on alors raisonnablement considérer qu'un 
taux de chômage de 8 %, observé en janvier, est « moins grave » et 
correspond à une meilleure performance socio-économique qu'un taux de 4 
% seulement mais qui serait observé en juillet ? 


Quand ces mesures sont désaisonnalisées, on constate que le taux de 8 % 
observé en janvier est ramené à 5 % seulement quand on a corrigé le facteur 
saisonnier qui est responsable d'une survalue de 3 % par rapport à la 
moyenne annuelle. De la même façon, le taux de 4 % mesuré en juillet 
correspond à un taux désaisonnalisé de 6 % après la hausse de 2 % qui 
corrige le facteur saisonnier. Même si, dans l'absolu, le taux de chômage 
était plus fort en janvier qu'en juillet (8 % contre 4 %), on peut conclure que 
les conditions générales d'emploi étaient meilleures en janvier qu'en juillet. + 


Pour désaisonnaliser une série chronologique, il faut connaître la longueur k 
de la période ainsi que les moyennes H,;,H,;,..., L, correspondant à chaque 
unité de la période. Si, par exemple, on effectue une mesure à tous les mois 
et qu'on considère un cycle annuel, on prendra k = 12 et les 12 moyennes 
correspondront à chacun des mois de l'année. Si l'on effectue une mesure à 
toutes les heures, un cycle quotidien correspond à k = 24. 


Les moyennes théoriques H,;H,,.., M, sont rarement connues avec 
exactitude et sont habituellement remplacées par des moyennes 
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EXEMPLE 7 


expérimentales x,,x ,X, qui peuvent avoir été déterminées par des 


20 * k 


expériences précédentes ou qui peuvent aussi être directement calculées à 
partir des données x,,x,,...,x, dont nous disposons. 


La moyenne x, sera alors obtenue en ne considérant que les observations 


x … De même, pour j allant de 1 à k, x; est la moyenne de 


1? Xyu 2 Yoga ? Xyyu 77 
toutes les observations dont la phase est j, c'est-à-dire, les observations 


# d X 44 d Xox d 3x4; è etc. 


Quand les moyennes x; ont été calculées, on peut évaluer la moyenne 


générale x, qui est simplement la moyenne de ces k moyennes. Si la série 
contient un nombre exact de périodes (c'est-à-dire, si T est un multiple entier 
de k), la moyenne *x sera égale à la moyenne ordinaire x des T observations. 
Habituellement, T n'est pas un multiple exact de k et les moyennes x et x 
seront légèrement différentes. 

La série x,,x,,..., x, peut enfin être désaisonnalisée et transformée en une 


nouvelle série y,,y,,...,y, où les y, sont obtenues des x, en leur 


soustrayant les effets de phase >, er 


où j est la phase correspondant à t (c'est-à-dire t est de la forme nk+joùn 
est un nombre entier). 


Le tableau 11.7 donne les taux de chômage dans une certaine région, au 
cours des 98 derniers mois. 


Le taux moyen de chômage est x = 6,6. Remarquons que la moyenne 
ordinaire des 98 observations est x = 6,57. La différence entre ces deux 
moyennes est due au fait qu'on dispose de 9 observations pour les mois de 
mai et de juin alors qu'on n'en a que 8 pour chacun des 10 autres mois. 

Le taux moyen pour janvier (8,2) dépasse de 1,6 la moyenne annuelle qui est 
de 6,6. Pour janvier, l'effet de phase est donc de 1,6. Poursuivant ces calculs 
pour chacun des 12 mois de l'année on obtient que les effets de phase, de 
janvier à décembre, sont, respectivement, 


16: Le: AS VOL 20’ LS. AL AS LS 04 09 LS 
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Remarquons au passage que la somme des effets de phase est 
nécessairement zéro puisque la somme des x ; St précisément égale à kx. 


TABLEAU 11.7 Taux de chômage durant une période de 98 mois 


Année Jan. Fév. Mars Avr. Mai Juin Juill Août Sept. Oct. Nov. Déc. 
1 - - - - 5,2 5,0 5,0 5,5 5,4 6,3 7,2 8,8 
2 8,5 8,7 7,9 6,8 6,2 5,9 6,4 6,3 6,5 7,6 7,9 9,4 
3 9,7 9,6 8,4 7,2 6,4 6,1 6,6 6,6 6,2 7,2 7,5 8,5 
4 8,8 8,7 8,2 6,7 5,5 5,2 4,9 4,8 4,9 6,8 6,8 7,9 
5 7,8 7,7 6,9 5,7 5,2 4,4 4,3 4,2 4,4 5,1 6,8 7,0 
6 7,0 7,0 7,0 5,7 4,6 4,6 3,9 4,0 4,1 4,7 5,6 7,0 
7 7,4 8,3 8,3 7,9 6,4 6,0 6,0 5,4 5,3 6,0 6,5 8,0 
8 8,1 8,1 7,9 7,1 6,0 5,2 5,0 5,4 5,3 6,2 6,9 8,4 


9 8,5 8,9 8,3 6,5 5,2 4,9 - - 5 - : 5 
Moyennes 8,2 8,4 7,9 6,7 5,6 5,3 5,3 5,3 5,3 6,2 6,9 8,1 


Les données du tableau 11.7 peuvent être enfin désaisonnalisées en 
soustrayant à chaque observation l'effet de phase qui correspond au mois 
qui convient. On obtient le tableau 11.8. 


TABLEAU 11.8 Taux de chômage désaisonnalisés issus du tableau 11.7 


Année Jan. Fév. Mars Avr. Mai juin Juill. Août Sept. Oct. Nov. Déc. 
1 - - - - 6,2 6,3 6,3 6,8 6,7 6,7 6,9 7,3 
2 6,9 6,9 6,6 6,7 7,2 7,2 7,7 7,6 7,8 8,0 7,6 7,9 
3 8,1 7,8 7,1 7,1 7,4 7,4 7,9 7,9 7,5 7,6 7,2 7,0 
4 7,2 6,9 6,9 6,6 6,5 6,5 6,2 6,1 6,2 7,2 6,5 6,4 
5 6,2 5,9 5,6 5,6 6,2 5,7 5,6 5,5 5,7 5,5 6,5 5,5 
6 5,4 5,2 5,7 5,6 5,6 5,9 5,2 5,3 5,4 5,1 5,3 5,5 
7 5,8 6,5 7,0 7,8 7,4 7,3 7,3 6,7 6,6 6,4 6,2 6,5 
8 6,5 6,3 6,6 7,0 7,0 6,5 6,3 6,7 6,6 6,6 6,6 6,9 
9 6,9 7,1 7,0 6,4 6,2 6,2 - - - - - - 


Remarquons que dans le tableau 11.8 où les données sont désaisonnalisées, 
les moyennes, pour chacune des 12 colonnes, sont toutes égales entre elles 


(et égales à la moyenne générale x). 


Le tableau 11.8 reflète mieux que le tableau 11.7 les fluctuations 
significatives du taux de chômage. L'effet saisonnier y a été corrigé et les 
comparaisons, d'une période à l'autre, sont plus équitables. 
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11.4 


ANALYSE DE LA TENDANCE GÉNÉRALE 


Le moment est venu d'introduire le hasard dans nos modèles, de considérer 


des séries chronologiques formées de variables aléatoires X,X#,,...,X, 


plutôt que de nombres fixes x,,x,,...,x,. 
On observe fréquemment que les données d'une série chronologique ont 
tendance à se concentrer le long d'une courbe douce. Il est alors naturel 


d'exprimer chacun des termes X, de la série sous la forme 


X = f{t)+y, 


où la fonction f (f représente cette courbe douce (appelée tendance générale) 
et où les Y, sont des fluctuations aléatoires (ou des erreurs de mesure) plus 
ou moins grandes qui font osciller les X, de part et d'autre de la tendance 


générale f (. Ces Y 


,, Sont des variables aléatoires de moyenne nulle. De 
plus, on les suppose généralement indépendants et identiquement distribués. 


C'est implicitement un tel modèle qui était sous-jacent lorsque, dans la 
section 11.1, nous appliquions une moyenne mobile pour lisser une série 
chronologique et la débarrasser des dents de scie provoquées par les Y,. La 
série lissée fournissait alors une estimation raisonnable de la tendance f ({). 

Quand on ne dispose d'aucune information préalable au sujet de la tendance f 
(h, on ne peut guère faire mieux que l'approximer par les valeurs X , de la 
série lissée. Si, par contre, on sait ou on suppose que les X, ont tendance à 
croître ou à décroître de façon linéaire, on peut faire beaucoup mieux : on peut 
estimer directement les paramètres a et b de la fonction f ( = a + btet les 


dents de scie seront alors complètement éliminées. Il suffit donc de déterminer 
la droite de régression qui passe le mieux parmi les points (1, X,), (2, X,), …, 


(T, X,). 
Régression linéaire Dans le chapitre 4, nous avons traité d'un problème 


analogue. Les notations étaient un peu différentes : nous disposions de n 
points (x,,y,), (x,,y,), .…., (x,, y,). Maintenant nous avons plutôt T couples 


(1, X,), .…, (T, X,). La substitution est aisée : il suffit de réécrire les 


formules du chapitre 4 en remplaçant n par T, ipart, x, partet y, par X,. 


EXEMPLE 8 
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On obtient les formules 
b= ZX, -(51)Ex, VT 
2e -(r) /T 
ä=X-b(Sr)/T. 


Remarquons que nous notons par 4 et b les paramètres de la droite de 
régression estimée ñ (4)= à +bt afin de bien les distinguer des paramètres 
théoriques a et b de la droite idéale f (ÿ = a + bt. Notons aussi que ces deux 
formules peuvent être simplifiées en remplaçant Z+ par T(T+1)/2et Xr° par 
T (T + 1) (2T + 1)/6. Après quelques manipulations algébriques élémentaires, 
les deux formules deviennent 

LHbSE (Tino) 

ie) 


ä=X-b(T+1)/2. 


Pour déterminer les valeurs de à et b, on n'a donc que deux sommes à 
calculer, soit ZX, et XX. 
De plus, si l'on veut estimer la hauteur f Fe ) atteinte par la droite de régression 


(théorique) en un nouveau temps que nous notons f,, l'estimateur naturel à 


utiliser est f (4, )= à+bt,. Ce f (,) est simplement la hauteur atteinte, au 


temps f,, par la droite de régression expérimentale ajustée à la série. 


Le tableau suivant indique quelle a été la production canadienne de blé (en 


millions de tonnes) pour chacune des années de 1971 à 1996, selon 
Statistique Canada : 


Année tft Production de Ans. 4 Production de Année ft Production de 

blé blé blé 
1971 1 14,4 1980 10 19,3 1989 19 24,8 
1972 2 14,5 1981 11 24,8 1990 20 32,1 
1973 3 16,2 1982 12 26,7 1991 21 31,9 
1974 4 13,3 1983 13 26,5 1992 22 29,9 
1975 5 17,1 1984 14 21,2 1993 23 27,2 
1976 6 23,6 1985 15 24,3 1994 24 22,9 
1977 7 19,9 1986 16 31,4 1995 25 25,0 
1978 8 21,1 1987 17 25,9 1996 26 29,8 
1979 9 17,2 1988 18 15,9 
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FIGURE 11.7 


Production canadienne de blé (en millions de tonnes) de 1971 à 1996 et prédiction pour l'an 2010. 


prédiction 37,7 
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En supposant que ces productions suivent une progression linéaire affectée 
de fluctuations aléatoires (principalement dues aux conditions climatiques et 
aux aléas du commerce agricole) qu'on considère indépendantes d'une année 
à l'autre, estimer l'augmentation annuelle théorique (b) et prédire la 
production pour l'an 2010. 


On a T = 26 et un calcul rapide donne ZX, = 596,9 et ZX, = 8 872,0. 


On obtient donc 
_ 6(251X,-(T+1)2X,) 6(2x8872-27x596.9) 9 766,2 
F\r 21) 26(676 -1) 17 550 


= 0,556 5 


, 


59 
äà=X-B6(T+1)/2- 


—0,556 5x13,5 15,445. 


Dans notre série chronologique, l'année 1971 correspondait au temps t = 1 
et l'année 1996 correspondait à t = T = 26. L'année 2010, pour laquelle on 
veut obtenir une estimation de la production correspond donc au temps 
1, =2010- 1970 = 40. L'estimation ponctuelle de f (1,) est à+bt, = 


15,445 +0,556 5x40 =37,7. 


En résumé, la production canadienne de blé augmente d'environ 0,556 5 
millions de tonnes par année et devrait, en l'an 2010, être de l'ordre de 


EXEMPLE 9 
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37,7 millions de tonnes. La figure 11.7 permet de visualiser le passage de la 
droite de régression parmi les 26 observations ainsi que son prolongement 
jusqu'à l'an 2010. 


Transformation logarithmique Dans la nature, les progressions linéaires sont 
passablement rares. Beaucoup plus fréquemment, on a affaire à des 
progressions pour lesquelles le taux d'accroissement est constant (ou peut 
raisonnablement être supposé constant sur un intervalle de temps plus ou 
moins long). Si le taux d'accroissement est constant, la suite des 
observations successives formera une progression exponentielle (on dit aussi 
géométrique). Ce sont donc les logarithmes des observations successives qui 
formeront une progression linéaire (ou arithmétique). On peut, au choix, 
utiliser les logarithmes naturels (en base e) ou les logarithmes vulgaires (en 
base 10). 


Afin de pouvoir conserver les notations utilisées dans le modèle linéaire qui 
vient d'être développé, nous noterons maintenant par W,,W,,...,W, la série 
chronologique originale et par X,,%X,,..., X, la nouvelle série obtenue en 


posant X, =log W,,pourt=1,2,...,T. 


Fondamentalement, il n'y a rien de bien nouveau. Il faudra simplement 
prendre soin de retraduire, en fin de compte, en termes de W=e”* (ou 


W =10" si le logarithme est en base 10) les résultats obtenus concernant 
X = log W. 


Le tableau suivant indique les nombres de sites internet actifs dans le 
monde, au milieu de chacune des années 1991 à 1998. 


Nombre de Nombre de 
Année t AR Année t Fo 
sites internet sites internet 
1991 1 535 000 1995 5 6 642 000 
1992 2 992 000 1996 6 12 881 000 
1993 3 1 776 000 1997 7 19 540 000 
1994 4 3 212 000 1998 8 36 739 000 


Quel devrait être le nombre de sites internet dans le monde en l'an 2005 ? 


Visiblement, ces données ne sont pas en progression linéaire. Une 
progression exponentielle est beaucoup plus naturelle. Chacune de ces T = 8 
données sera donc remplacée par son logarithme (nous utiliserons les 
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FIGURE 11.8 


logarithmes naturels, mais les logarithmes en base 10 feraient tout autant 
l'affaire). On obtient la nouvelle série qui suit : 


13,1900 13,807 5 14,3899 149824 15,/089 16,3713 16,7880 17,419 3 
Un calcul rapide permet d'obtenir 
>,X,=122,657 3 et S'1X,=577,547 0 
Les paramètres 6 et à de la droite de régression sont donc 


6 6(2x577,547 0-9x122,657 3) 


= 0,609 27 
8x63 
122,657 3 0,609 27x9 
â = = 12,590 45 
8 2 


L'an 2005 correspond à t, =15, onobtient f(t,)=à+b6t, =12,590 45 +0,609 27 = 
21,729 50. Rappelons que cette valeur correspond au logarithme du nombre 


de sites internet en l'an 2005. Le nombre de sites internet devrait être voisin 
de e°"7#%% _2735 milliards. 


Les figures 11.8 et 11.9 illustrent graphiquement ces résultats. 


Droite de régression ajustée au logarithme du nombre de sites internet et extrapolation jusqu'à 
l'an 2005. 


prédiction 21,729 50 
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FIGURE 11.9 
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P.N.B. canadien (en milliards de dollars) et extrapolation exponentielle jusqu'à l'an 2000. 


prédiction 2,735 milliards 
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Il va de soi que la prédiction qui vient d'être calculée pour l'an 2005 ne sera 
valide que si, entre les années 1998 et 2005, le nombre de sites internet 
parvient à conserver le même taux d'accroissement que celui qui a été 
observé durant les années 1991 à 1998 (c'est-à-dire, pratiquement doubler à 
chaque année). Cette supposition est hautement irréaliste car elle mène, à 
moyen terme, à des résultats absurdes. Dès 2005, on obtient une prédiction 
du nombre de sites internet correspondant à près de 40 % de la population 
mondiale. i on voulait faire une prédiction pour l'an 2030, on obtiendrait 
environ un million de site internet par habitant de la planète. Disons 
simplement, pour conclure, que «la nature a horreur des progressions 
exponentielles ». À court terme, ça peut aller, mais à long terme, il faut être 
prudent et user de son jugement, ce qui déborde du champ des simples 
techniques mathématiques. 
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11.5 


RÉSIDUS ET BRUIT BLANC 


Lorsqu'on ajuste un modèle (régression, désaisonnalisation, etc.) à une série 
chronologique X,, on cherche, idéalement, à déterminer une formule qui 


permette d'exprimer le plus correctement possible X, en fonction de t. 
Habituellement on ne peut pas obtenir un ajustement parfait ; il reste 


toujours des différences, des écarts entre les X, et les À , fournis par le 
modèle. Dans le cas d'une régression, La = f(1)= à+bt. Dans le cas d'une 


désaisonnalisation de période k, 6 , est la moyenne de toutes les 
observations qui ont la même phase que X,, c'est-à-dire, dont les indices 


diffèrent de t par un multiple exact de la période k. 


Les écarts D =X, ES 4 , portent le nom de résidus. Ils correspondent à la 


partie des fluctuations de la série originale qui a résisté au modèle, que le 
modèle n'a pas réussi à expliquer. 


Lorsqu'on analyse la structure d'une série chronologique, on cherche à y 
ajuster un modèle qui fournira des résidus (de moyenne nulle) dont la 
variance sera aussi petite que possible. Quand, après régression, après 
désaisonnalisation, on obtient une suite de résidus qui se comportent 
comme des variables indépendantes et toutes de même loi, on a extrait tout 
le jus du citron, toute la structure de la série. On bute alors sur le « hasard 
pur » et il n'y a plus aucune information à tirer de ces résidus sinon en 
estimer la variance, en déterminer la distribution commune. Une telle suite 
de variables de moyenne nulle, indépendantes et de même loi, porte le nom 
de bruit blanc. 


Tant qu'on n'est pas arrivé à des résidus formant un bruit blanc, on n'a pas 
encore extrait tout le jus du citron ; il y a encore de l'information à tirer de 
ces résidus. En modélisant la façon dont ils sont liés entre eux, on peut 
souvent réduire encore davantage le rôle du hasard, obtenir les « résidus des 
résidus » et pousser plus loin l'analyse jusqu'à ce qu'on bute enfin sur un 
bruit blanc et qu'il ne reste que l'écorce du citron. Dans un bruit blanc, les 
variables sont indépendantes et se comportent comme un échantillon 
simple ; l'ordre dans lequel elles se présentent n'a donc plus aucune 
signification particulière et l'analyse de la série chronologique est achevée. 
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Quand une suite de résidus D,, D,,..., D, ne forme pas un bruit blanc, c'est 
habituellement la condition d'indépendance entre les résidus successifs D, 


et D,, qui n'est pas satisfaite. Une façon simple de détecter et de visualiser 


la dépendance qui peut exister entre les résidus successifs s'obtient en 
observant l'allure du nuage de points formé par les T - 1 couples de résidus 
successiis (D,,D,),(D.,D.),(D::D,):.:, (D D}: 


T1? 


EXEMPLE 10 Les 20 résidus suivants forment-ils un bruit blanc ? 


FIGURE 11.10 


t à) t D, ’ D, : D, 
1 0,937 6 -0,432 11 -0,998 16 0,822 
2 1,883 7 -0,637 12 -1,183 17 0,358 
3 1,499 8 0,057 13 -0,507 18 0,227 
4 -0,063 9 -1,050 14 -0,447 19 -0,623 
5 0,134 10 -0,978 15 0,728 20 0,273 


Solution : Les 19 couples de résidus successifs (0,937 ; 1,883), (1,883 ; 1,499), 
…, (-0,623 ; 0,273) fournissent le nuage de points illustré par la figure 11. 10. 


Les 19 couples (D, D...) de résidus consécutifs 


t+1 


2 D: 5 
+ 
1 
pe + 
+ + La 
0 + LU + 
d % * 
4 
ke 4 # 


On remarque que ce nuage de points a une nette tendance oblique, 
caractéristique d'un coefficient de corrélation significativement positif. Ce 
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coefficient de corrélation se calcule directement en utilisant les formules 
développées au chapitre 4 en prenant Y#, =D, et Y,=D,, pour i = 1, 2, 


, 19. 
On obtient ZX, =-0,273; ZX? 13,973; XY, =-0,937: XV? =13,170 et EX,Y, = 


8,952, qui donne r = 0,660. Avec n = 19, on trouve Z = yn 2r | 1-r°? =3,62, 


valeur nettement supérieure à 2 et fortement indicatrice d'une dépendance 
réelle entre les résidus successifs. La suite D,, D,,..., D, n'est donc pas un 


bruit blanc. + 


Lorsque, après avoir ajusté un modèle à une série chronologique X,, on 
obtient des résidus D, qui ne sont pas un bruit blanc, il reste encore « du jus 


dans le citron », de la structure à modéliser. Les techniques qu'il convient 
alors d'appliquer débordent du cadre élémentaire dans lequel nous devons 
nous restreindre. Sans entrer dans les détails des processus auto-régressifs, 
signalons simplement l'existence de modèles qui permettent d'exprimer 
chaque résidu comme combinaison linéaire des résidus voisins, plus un 
terme résiduel qui, si tout va bien, aura (enfin !) une structure de bruit 
blanc. 


RÉSUMÉ 


1. Une série chronologique est une suite de mesures x,,x,,..,x, 


effectuées sur un phénomène qui varie dans le temps. 


2. Une moyenne mobile est une technique de lissage qui consiste à 
remplacer chaque observation x par une moyenne pondérée de 


plusieurs observations voisines : 


:(8)/(#) 


3. Le lissage exponentiel est une technique de lissage dans laquelle 


chaque observation x, est remplacée par x, =0x, + (1-6 Je: , où 6 estun 


nombre fixe choisi entre O et 1. 


Une prédiction pour x, s'obtient alors en calculant *,, =2%, - : 
+1 T+1 T T1 
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Lorsque l'unité de mesure n'a pas une valeur constante, il faut en tenir 
compte pour comparer convenablement des mesures effectuées à des 
moments différents. On utilise alors une table qui indique les valeurs 
successives de l'unité de mesure et qui, par commodité, accorde souvent 
une valeur conventionnelle de 100 pour un certain instant de référence. 


Une série chronologique dans laquelle se manifestent des fluctuations 
régulières de période À peut être désaisonnalisée en soustrayant à 


chaque observation x, l'effet de phase x, x correspondant à l'indice t. 
La quantité x, est la moyenne de toutes les observations 


x qui ont la même phase que x, c'est-à-dire, dont les 


PE CU 


indices diffèrent de t par un multiple exact de la période k. La quantité x 


est la moyenne des k moyennes x ,X,,..., x, associées à chacune des k 


phases de la période. 
Les séries chronologiques se présentent souvent sous la forme 
X, =f(t)+Y 
où f (4 est une tendance générale douce et où les Y, sont des 


fluctuations aléatoires indépendantes, identiquement distribuées et de 
moyenne théorique nulle. 


Si la tendance est linéaire (c'est-à-dire, f (4 = a + bt) les paramètres a et 
b peuvent être estimés par 


. 6(2X1%x,-(T+1)5x,) 
r(r*-1) 


ä=X-Bb(T+1)/2 


et f(1,) peut être estimé par nl )= à+ br. 


7. 


Si l'allure générale de la série est exponentielle plutôt que linéaire, on 
effectuera une régression linéaire passant parmi les logarithmes des 
observations originales. 

L'ajustement d'un modèle à une série chronologique permet d'approximer 
chaque X, par la valeur La obtenue du modèle. Les écarts D =X, -X 


sont appelés les résidus et correspondent à la partie des fluctuations de 
la série originale qui subsiste encore après l'ajustement du modèle. 
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9. 


10. 


Une suite de variables aléatoires indépendantes, identiquement 
distribuées et de moyenne nulle porte le nom de bruit blanc. Quand une 
suite de résidus forme un bruit blanc, il n'y a plus rien à en tirer : le 
modèle a extrait tout le jus du citron. 


Une corrélation significativement non nulle entre les résidus successifs 
permet de conclure qu'on n'a pas encore atteint l'objectif d'un bruit blanc 
et qu'il est possible d'aller plus loin dans l'analyse de la série. D'autres 
modèles plus avancés prennent alors la relève... 


EXERCICES 


TECHNIQUES DE 1. 


LISSAGE 


Le tableau suivant indique, pour chacune des années allant de 1960 à 
1987, le nombre d'immigrants reçus par le Canada. 


Nombre Nombre Nombre Nombre 
Année  d'immigrants Année  d'immigrants Année  d'immigrants Année  d'immigrants 

1960 104 111 1967 222 876 1974 218 465 1981 128 618 
1961 71 689 1968 183 974 1975 187 881 1982 121 147 
1962 74 586 1969 161 531 1976 149 429 1983 89 157 
1963 93 151 1970 147 713 1977 114 914 1984 88 239 
1964 112 606 1971 121 900 1978 86 313 1985 84 302 
1965 146 758 1972 122 006 1979 112 096 1986 99 219 
1966 194 743 1973 184 200 1980 143 117 1987 152 098 


SOURCE : Emploi et Immigration Canada 


a) Tracez le graphique de cette série chronologique. 


b) Lissez cette série en y ajustant une moyenne mobile de rayon r = 2, 
avec poids égaux. 

c) Lissez la même série en y ajustant une moyenne mobile de rayon 
r = 2, avec poids binomiaux. 

d) Appliquez à cette série un lissage exponentiel avec 6 =+ Quelle 
« prédiction » obtient-on pour 1988 ? 


NOMBRES 
INDICES 
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2. Le tableau suivant indique les nombres de naissances qui ont eu lieu, au 


Canada, durant chacune des années 1925, 1930, 1935, .., 1985. 


Année Nombre de naissances Année Nombre de naissances 

1925 249 365 1960 478 551 
1930 250 335 1965 418 595 
1935 228 396 1970 371 988 
1940 252 577 1975 359 323 
1945 300 587 1980 370 709 
1950 372 009 1985 375 727 
1955 442 937 


SOURCE : Statistique Canada 
a) Tracez le graphique de cette série chronologique. 


b) Lissez cette série en y ajustant une moyenne mobile de rayon r= 1, 
avec poids binomiaux. 

c) Appliquez à cette série un lissage exponentiel avec 0 =+. Quelle 
« prédiction » obtient-on pour l'an 1990 ? 

Lancez un dé 20 fois et engendrez une série chronologique artificielle 

A Anis À Lissez cette série en y ajustant une moyenne mobile 


avec poids binomiaux où r vaut 1, 2, 3 et 5. Vérifiez que ces 4 lissages 
sont de plus en plus stables. 


20 * 


Un acériculteur a gardé registre de la quantité de sirop d'érable qu'il a 
produit durant chacune des 12 dernières années. Voici les résultats, 
exprimés en litres. 


6 815 8 320 6310 6 740 5 200 4 400 6 350 5 340 3 660 4 570 
4735 3 420 


Appliquez à cette série un lissage exponentiel avec 8 =+. Quelle 


prédiction obtient-on pour la production prochaine ? 


Calculez de nouveau les indices des prix à la consommation présentés 
dans le tableau 11.4 de telle sorte que l'année de référence (pour laquelle 
l'indice est 100) soit 1985 plutôt que 1981. 


En utilisant les indices des prix à la consommation présentés dans le 
tableau 11.5, résolvez les problèmes suivants : 
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a) Combien coûtait, en 1960, un habit comparable à celui qui coûtait 
250 $ en 1985 ? 

b) Combien coûtait, en 1985, une maison qui coûtait 25 000 $ en 
1950 ? 


c) En 1960, une certaine famille consacrait 31 % de ses dépenses à 
l'alimentation, 36 % à l'habitation, 10 % aux vêtements, 11 % aux 
transports, 3 % aux frais de santé, 6 % aux loisirs et 3 % au tabac et 
à l'alcool. Quel serait le partage des dépenses, selon chacune des 7 
catégories, pour obtenir, en 1987, des produits équivalents dans des 
proportions semblables ? 

7. Le tableau suivant indique la valeur moyenne du dollar canadien, 
exprimée en dollars américains, en livres britanniques, en francs 


français, en marks allemands et en yens japonais, pour chacune des 
années allant de 1965 à 1987. 


Année dollars US. livres francs marks yens 
1965 0,9276 0,3318 4,5454 3,7051 333,8898 
1966 0,9282 0,3323 4,6000 3,7120 336,1345 
1967 0,9270 0,3372 4,6000 3,6955 335,6831 
1968 0,9281 0,3877 4,5956 3,7051 334,5601 
1969 0,9287 0,3885 4,8123 3,6417 332,7787 
1970 0,9579 0,3997 5,2938 3,4928 342,9355 
1971 0,9903 0,4051 5,4555 3,4483 343,4066 
1972 1,0096 0,4033 5,0891 3,2175 305,8104 
1973 0,9999 0,4076 4,4307 2,6441 270,5628 
1974 1,0225 0,4370 4,9140 2,6420 298,1515 
1975 0,9830 0,4426 4,2070 2,4131 291,5452 
1976 1,0141 0,5615 4,8379 2,5510 300,5711 
1977 0,9403 0,5385 4,6189 2,1805 251,2563 
1978 0,8770 0,4568 3,9448 1,7572 182,4818 
1979 0,8536 0,4023 3,6311 1,5640 186,0465 
1980 0,8554 0,3677 3,6088 1,5518 192,9385 
1981 0,8340 0,4117 4,3346 1,8804 183,4862 
1982 0,8103 0,4634 5,3050 1,9662 201,3693 
1983 0,8114 0,5352 6,1576 2,0687 192,6782 
1984 0,7723 0,5780 6,7250 2,1911 183,2509 
1985 0,7325 0,5649 6,5232 2,1381 173,4004 
1986 0,7197 0,4905 4,9751 1,5564 120,5400 
1987 0,7541 0,4603 4,5290 1,3543 108,8376 


SOURCE : Banque du Canada 


a) Quelle a été, chaque année, la valeur moyenne du dollar américain, 
exprimée en dollars canadiens ? 
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Remarque En toute rigueur, l'inverse d'une moyenne n'est pas 
exactement égal à la moyenne de l'inverse. Les résultats seront donc 
approximatifs. 


Quelle a été, chaque année, la valeur de la livre anglaise, exprimée en 
francs français ? 


Pour chacune des années 1965, 1970, 1975, 1980 et 1985, quelle 
était la valeur du dollar américain, exprimée dans chacune des cinq 
autres unités monétaires ? 


Pour chacune des années de 1966 à 1987, déterminez quelle 
monnaie s'est le plus (le moins) appréciée depuis l'année précédente 
par rapport au dollar canadien. Exprimez ce taux d'appréciation en 
pourcentage. 


En 1981, un spéculateur français a converti 10 000 francs en marks 
allemands. En 1984 il a reconverti ses marks en francs. Combien de 
francs a-t-il reçus ? Quel a été le taux de rendement annuel de cet 
investissement ? 


Le tableau suivant indique la valeur du pétrole sur les marchés 
mondiaux (en dollars US) pour chaque année allant de 1970 à 1987. Par 
convention, l'indice vaut 100 pour l'année 1980. 


Prix du pétrole Prix du pétrole 

panes en dollars USS. Annee en dollars USS. 
1970 4,5 1979 60,2 
1971 5,8 1980 100,0 
1972 6,6 1981 113,4 
1973 9,4 1982 116,8 
1974 34,4 1983 102,2 
1975 37,4 1984 99,3 
1976 40,1 1985 99,3 
1977 43,3 1986 45,0 
1978 44,3 1987 50,0 


SOURCE : Banque Mondiale 


a) 


Utilisant les données fournies par le tableau du problème 7, 
exprimez, pour chaque année allant de 1970 à 1987, le prix du 
pétrole en dollars canadiens (Affectez l'indice 100 à l'année 1980). 
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DÉSAISONNA- 
LISATION 


9. 


b) Utilisant ensuite l'indice des prix à la consommation au Canada (voir 
tableau 11.4) exprimez le prix du pétrole pour chacune de ces années 
en dollars canadiens constants. (Affectez l'indice 100 à l'année 1987). 


c) Quel a été, pour chacune des années allant de 1971 à 1987, le taux 
d'accroissement du prix de pétrole en monnaie américaine ? en 
monnaie canadienne ? 


Le gérant d'un marché d'alimentation a établi combien de clients se sont 
présentés dans son établissement durant chacun des 31 jours du mois 
dernier. Il a obtenu les données du tableau en haut de la page suivante 
où sont aussi indiqués les jours de la semaine. 


a) En ne considérant que les jours où le commerce est ouvert, 
déterminez les moyennes x ; correspondant à chacun de ces 6 jours. 


b) Quelle est la moyenne générale X s'appliquant aux jours ouvrables ? 
c) Quel est l'effet de phase correspondant à chacun de ces 6 jours ? 


d) Désaisonnalisez (selon le jour de la semaine) les 27 données du 


tableau. 
Dimanche Lundi Mardi Mercredi Jeudi Vendredi Samedi 

1 2 3 4 5 6 
142 89 95 176 316 338 
7 8 9 10 11 12 13 
(fermé) 108 85 103 178 330 320 
14 15 16 17 18 19 20 
(fermé) 112 77 86 158 352 307 
21 22 23 24 25 26 27 
(fermé) 97 82 92 196 308 335 

28 29 30 31 


(fermé) 130 70 102 


ANALYSE DE 
LA TENDANCE 


GENÉRALE 
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10. Le tableau suivant indique quelles ont été, à Montréal, les températures 


diurnes moyennes (en degrés Celsius) et les précipitations mensuelles 
moyennes (en millimètres d'eau) observées durant la période de 30 ans 
allant de 1951 à 1980. 


Jan. Fév. Mars Avr. Mai Juin Juill Août Sept. Oct. Nov. Déc. 


Températures  -10 -9 -3 6 13 18 21 20 15 9 2 -7 


(C) 


Précipitations 72 65 74 74 66 82 90 92 88 76 81 87 


(mm) 


SOURCE : Environnement Canada. 


11. 


a) Déterminez l'effet de phase correspondant à chacun des 12 mois en 
ce qui concerne la température ; les précipitations. 


b) Pour chacun des 12 mois, établissez les précipitations moyennes 
quofidiennes en tenant compte du nombre différent de jours qu'il y a 
d'un mois à l'autre. Représentez graphiquement les résultats. 


Le tableau suivant indique, pour chacune des années 1980 à 1987 quel 
était, au Canada, le prix moyen de l'huile à chauffage, du gaz naturel et 
de l'électricité. 


a) En supposant que la progression des prix de ces trois produits est 
linéaire, évaluez les paramètres des droites de régression et prédisez 
les prix pour 1990, 1995, 2000. 


Ann Huile à ChUTRNS Gaz ol Électricité 

(é par litre) (é par m') (é par kWh) 
1980 16,9 10,6 3,3 
1981 24,4 13,2 3,7 
1982 30,1 15,4 4,1 
1983 33,3 18,0 4,2 
1984 35,5 18,5 4,8 
1985 38,3 19,4 5,0 
1986 30,9 19,3 5,2 
1987 29,1 18,6 5,4 


SOURCE : Mines et Ressources Canada 


b) Faites de même en exprimant les prix en monnaie de 1987. (Utilisez 
le tableau 11.4 pour effectuer les conversions). 
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12. Le tableau suivant indique quelle était la population du Canada, de 
l'Ontario, du Québec ainsi que de cinq importants centres urbains lors 
des recensements de 1951, 1961, 1971 et 1981. (Les populations sont 
exprimées en milliers d'habitants). 


15. 


1951 1961 1971 1981 

Canada 14 009 18 238 21 568 24 343 
Ontario 4 598 6 236 7 703 8 625 
Québec (prov.) 4 056 5 259 6 028 6 438 
Montréal 1 539 2 216 2 743 2 828 
Toronto 1 262 1 919 2 628 2 999 
Vancouver 586 827 1 082 1 268 
Ottawa-Hull 312 457 603 718 
Québec (ville) 289 379 481 576 


a) En supposant que les progressions sont linéaires, prédisez quelles 
seront ces huit populations en l'an 1991, en 2001. La supposition de 
linéarité est-elle raisonnable ? 


b) Prédisez les populations pour l'an 1991 et l'an 2001 en supposant 
que les progressions sont exponentielles. Cette supposition est-elle 


raisonnable ? 


Le tableau suivant indique, pour chacune des années 1980 à 1987, le 
montant de la dette fédérale canadienne (en millions de dollars) ainsi que 


la dette per capita. 


Dette fédérale Dette Dette fédérale Dette 

Année : Année . 
(en 1 000 000 $) per capita (en 1 000 000 $) per capita 

1980 72 159 2 999 1984 160 768 6 399 

1981 85 681 3 520 1985 199 092 7 850 

1982 100 553 4 082 1986 233 496 9 209 

1983 128 369 5 158 1987 264 101 10 356 


a) En supposant que les progressions sont exponentielles, effectuez une 
prédiction pour la dette totale et pour la dette per capita en 1990, 


1995 et 2000. 


RÉSIDUS ET 


BRUIT BLANC 


DIVERS 


14. 


15. 


16. 


17. 
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b) Utilisant les données du tableau 11.4, exprimez ces deux séries en 
dollars constants de 1987. Effectuez les mêmes prédictions 
exprimées en dollars de 1987. 


Le tableau 11.8 présente les taux de chômage désaisonnalisés 
correspondant aux 98 données originales du tableau 11.7. Les 98 résidus 


obtenus en retranchant la moyenne générale x = 6,6 de ces données 
désaisonnalisées forment-ils un bruit blanc ? 
Remarque : D" D, =-0,7; 3" D? =54,49; SD D, =48,22 


1 


Ajustez une tendance exponentielle aux valeurs successives de l'indice 
des prix à la consommation (voir tableau 11.4). Calculez la liste des 48 
résidus. Forment-ils un bruit blanc? Commentez. 


Déterminez les valeurs des résidus obtenus après désaisonnalisation des 
données du problème 9 portant sur le nombre de clients qui se sont 
présentés chaque jour dans un certain établissement commercial. 


Représentez graphiquement ces résidus. Semblent-ils être un bruit 
blanc ? 


Le tableau de la page suivante indique (en dollars américains de l'année) 
les valeurs relatives des prix internationaux de quelques produits 
agricoles et miniers. La dernière colonne donne l'indice des prix à la 
consommation aux États-Unis. Dans chaque colonne, l'indice vaut 100 
pour l'année de référence 1980. 


a) Exprimez tous les prix en dollars constants de 1980. 


b) En quelle année chacun de ces produits était-il le plus cher ? le 
moins cher (en dollars constants) ? 
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c) Pour chaque produit, déterminez en quelle année s'est produite la 
plus forte hausse de prix et la plus forte baisse de prix (en dollars 


constants). 

Année Café Thé Sucre Argent Cuivre dollar US. 
1970 33,5 49,0 25,0 8,6 64,4 47,12 
1971 29,6 47,3 26,0 7,5 49,5 49,15 
1972 33,4 47,3 28,4 8,2 49,0 50,77 
1973 41,2 47,5 34,3 12,4 81,3 53,93 
1974 45,1 62,6 98,2 22,9 94,1 59,85 
1975 48,1 62,0 74,8 21,5 56,6 65,32 
1976 94,2 69,0 44,3 21,2 64,2 69,08 
1977 152,0 120,7 36,6 22,5 59,9 73,58 
1978 102,8 98,3 46,5 26,2 62,5 79,17 
1979 112,5 96,8 54,7 53,9 90,3 88,13 
1980 100,0 100,0 100,0 100,0 100,0 100,00 
1981 76,8 90,6 65,7 51,1 79,8 110,35 
1982 83,4 86,7 66,3 38,6 67,8 117,15 
1983 84,9 104,3 73,4 55,6 72,9 120,91 
1984 93,7 155,2 72,4 39,6 63,0 126,07 
1985 88,6 89,0 67,8 29,8 64,9 130,55 
1986 113,0 86,6 69,8 26,6 62,7 133,06 
1987 71,2 76,6 72,7 34,1 112,3 137,90 


SOURCE : Banque Mondiale 


18. Le tableau suivant indique combien de clients ont fait affaire avec une 
certaine agence de voyages durant chacun des trimestres des cinq 
dernières années. 


Année Jan.-Mars Avril-Juin Juill.-Sept. Oct.-Déc. 


1 1 248 2172 634 1 038 
2 1 273 1 304 1 029 1 866 
3 1 081 1614 852 1 578 
4 1 483 2 233 1 234 1 874 
5 2 023 2 607 1 120 1 981 


a) 


11 Séries chronologiques 389 


Ajustez une tendance exponentielle en effectuant une régression 
linéaire parmi les logarithmes des 20 observations. Déterminez les 20 
résidus. 


Désaisonnalisez ces 20 résidus en y ajustant une période de 
longueur 4. Déterminez les nouveaux résidus. Forment-ils un bruit 
blanc ? 


Établissez des prédictions pour chacun des trimestres des années 6 
et 7. 
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La notation de sommation 


n 
Le symbole DE signifie « la somme des nombres x, x 


i=1 


2% k 


EXEMPLE Soit x, =2,x, =3,x, =5,x, =1. Alors : 


4 

Dx,=x +x, +x,+x, =2+3+5+1=11 
3 

DA. =X +X, +Xx, =2+3+5=10 

4 

2x, =X,+X, +x, =3+5+1-9 


+ 


Lorsqu'on manipule le symbole de sommation, il est utile de 
retenir les quelques règles suivantes : 


a) 4x, =kŸ 7 x, où kest une constante. 
b) D ,k=nk,où kest une constante. 
C) Le (x, Ty; )= Die” DES 


EXEMPLE2 Soit x, =2,x, =3,x, =5,x, =1 ;et y, =7, y, =9, y, =11 et y, =5. 


a) Soit k = 3. Nous évaluons Duke et (RE pour illustrer la 
propriété (a) ci-dessus : 
4 
Dkx, = x, +kx, +kx, +kx, 
i=1 
=3x2+3x3+3x5+3x1=33 
4 
ET x, = k(x EAN +x,) 
i=1 


=3(2+3+5+1)=3(11)=33 
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L'expression A s'interprète comme la somme de n 
nombres, tous égaux à k. Sik=3etn=4,0ona: 

4 

53=-3+3+3+3-4x3=12 

i=1 


Nous évaluons >: (x, + ».) et > +> y, pour illustrer la 


propriété (c) ci-dessus : 


te +», )= 


Le +, +, +y, }+(x, +y; }+(x, +7.) 
2+7)+(3+9)+(5+11)+(1+5)= 43 


Y; +x, +Xx, +x,)+(y, +y, +y; +y.) 


4 4 
>x,+>y,= 


i=1 i=1 


( 
= ( 


2+3+5+1)+(7+9+11+5)= 43 


Les deux expressions D x,y, et (5 x (5, ».) ne doivent 


i=1" à 


pas être confondues. 


Par exemple : 

4 

DV, x +X,V, +XV; + 

i=1 

=2x7+3x9+5x11+1x5=101 

4 4 
Dx | y, |=(2+3+5+1)(7+9+11+5)=11x32=352 
i=1 i=1 


n 9: n 2 os 
Il ne faut pas non plus confondre D avec "x, 2 


4 
Dx =2° +3" +5" +1" =4+9+25+1=39 


; 2 
S. =(2+3+5+1)" =117 =121 


i=1 
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f) On peut également vérifier que : 


4 4 


4 4 
Day, =389; Dr +7] Xx? +2 y? =315 
i=1 i=1 


i i=1 


LA4+ 


4 4 4 
Gx° +2X;y, +y? )=35 x? +2Y x, y, +Y y? = 595 
i=l = i=l 


Exercices 


Soit x, =5,x, = 


Calculez : 


Réponses : a) 103 ; b) 549 ; c) 276; d) 2 627 ; e) 316. 
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TABLE 1  Coefficients {* ] du binôme de Newton 
nx 0 1 2 3 4 5 6 7 8 9 10 1 
0 1 0 0 0 0 0 0 0 0 0 0 0 
1 1 1 0 0 0 0 0 0 0 0 0 0 
2 1 2 1 0 0 0 0 0 0 0 0 0 
3 1 3 3 1 0 0 0 0 0 0 0 0 
4 1 4 6 4 1 0 0 0 0 0 0 0 
5 1 5 10 10 5 1 0 0 0 0 0 0 
6 1 6 15 20 15 6 1 0 0 0 0 0 
7 1 7 21 35 35 21 7 1 0 0 0 0 
8 1 8 28 56 70 56 28 8 1 0 0 0 
9 1 9 36 84 126 126 84 36 9 1 0 0 
10 1 10 45 120 210 252 210 120 45 10 1 0 
11 1 11 55 165 330 462 462 330 165 55 11 1 
12 1 12 66 220 495 792 924 792 495 220 66 12 
13 1 13 78 286 715 1287 1716 1716 1287 715 286 78 
14 1 14 91 364 1001 2002 3003 3432 3003 2002 1001 364 
15 1 15 105 455 1365 3003 5005 6435 6435 5005 3003 1365 
16 1 16 120 560 1820 4368 8008 11440 12870 11440 8008 4368 
17 1 17 136 680 2380 6188 12376 19448 24310 24310 19448 12 376 
18 1 18 153 816 3060 8568 18564 31824 43758 48620 43758 31824 
19 1 19 171 969 3876 11628 27132 50388 75582 92378 92378 75582 
20 1 20 190 1140 4845 15504 38760 77520 125970 167960 184756 167 960 
HE 
x 2 N=K 
TABLE2 Points critiques pour 72 
Es Point critique C Fee Point critique C ai Point critique C 
liberté liberté liberté 
v a=10% a=5%  a=1% a=10% a=5% a=1% a=10% a=5% a = 1% 
1 2,706 3,841 6,635 14 21,06 23,68 29,14 27 36,74 40,11 46,96 
2 4,605 5,991 9,210 15 22,31 25,00 30,58 28 37,92 41,34 48,28 
3 6,251 7,815 11,34 16 23,54 26,30 32,00 29 39,09 42,56 49,59 
4 7,779 9,488 13,28 17 24,77 27,59 33,41 30 40,26 43,77 50,89 
5 9,236 1107 15,09 18 25,99 28,87 34,81 40 51,81 55,76 63,69 
6 10,64 12,59 16,81 19 27,20 30,14 36,19 50 63,17 67,50 76,15 
7 12,02 1407 18,48 20 28,41 31,41 37,57 60 74,40 79,08 88,38 
8 13,36 15,51 20,09 21 29,62 32,67 38,93 70 85,53 90,53 100,4 
9 14,68 16,92 21,67 22 30,81 33,92 40,29 80 96,58 101,9 112,3 
10 15,99 18,31 23,21 23 32,01 35,17 41,64 90 107,6 113,1 124,1 
11 17,28 19,68 24,73 24 33,20 36,42 42,98 100 118,5 124,3 135,8 
12 18,55 21,03 26,22 25 34,38 37,65 44,31 
13 19,81 22,36 27,69 26 35,56 38,89 45,64 
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TABLE 3 Loi Normale N(0, 1) : Valeur de P(N(0, 1) > x) en fonction de x 


x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 
1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 
1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 
2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 
2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 
2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 
2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 
2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 
3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 
3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 
3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005 
3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003 
3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002 
3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 
3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 
3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 
3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 
3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 


Valeurs spéciales : 
P(N(0O,1) > 1,282) = 0,10 P(M0,1) > 1,645) += 0,05 P(M0,1) > 1,960) = 0,025 
P(N(0,1) > 2,326) = 0,01 P(MN0,1) > 2,576) + 0,005 P(M(0,1) > 3,090) = 0,001 


TABLE4 Loi de Student t, 
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Valeur tabulée : argument en fonction de la probabilité et du nombre de degrés de liberté v. 


P(t>c)=a 
v = 1(1)30, 40, 60, 120, co 

œ 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005 

V 
1 1,000 3,078 6,314 12,706 31,821 63,657 127,320 318,310 636,620 
2 0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,327 31,598 
3 0,765 1,638 2,353 3,182 4,451 5,841 7,453 10,214 12,924 
4 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610 
5 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869 
6 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959 
7 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408 
8 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041 
9 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781 
10 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587 
11 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437 
12 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318 
13 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221 
14 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140 
15 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073 
16 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015 
17 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965 
18 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922 
19 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883 
20 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850 
21 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819 
22 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792 
23 0,685 1,319 1,714 2,069 2,069 2,500 2,807 3,104 3,767 
24 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745 
25 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725 
26 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707 
27 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690 
28 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674 
29 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659 
30 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646 
40 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551 
60 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460 
120 0,677 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373 
co 0,674 1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291 


Pour les valeurs de v > 30, {, = M(O, v)/(v - 2)) 


Réponses aux exercices 


CHAPITRE 1! 


1. 
2. 


Variables quantitatives : a, d, e, f, h, i. 


c) Le polygone des fréquences présente deux sommets, le premier 


correspondant à peu près à la taille moyenne des Pygmées, le 
deuxième à la taille moyenne des Américains. 


Il est possible que le polygone des fréquences ait deux sommets, mais 
il est plus probable, étant donné la faible différence entre les deux 
sous-populations, qu'il n'en ait qu'un seul. 


Étant donné la faible proportion d'oranges gâtées dans le lot, on 
s'attend à ce qu'un grand nombre des paquets ne contienne aucune 
orange gâtée. Un certain nombre, assez important, des paquets 
contiendront une orange gâtée. Peu de paquets auront 2 oranges 
gâtées, encore moins en auront 3, .…, et très rares seront les paquets 
avec 12 oranges gâtées. Il est possible, par des moyens qui seront 
présentés au chapitre 6, de déterminer la distribution théorique de 
cette variable, c'est-à-dire la probabilité qu'un paquet tiré de ce lot 
contienne 0, 1, .…, 12 oranges gâtées. Voici les probabilités pour les 6 
premières valeurs : 


Nombre d'oranges 
gâtées 


Probabilité 0,540 4 0,341 3 0,098 8 0,017 3 0,002 1 0,000 2 


La fréquence des paquets avec «x» oranges gâtées devrait, 
intuitivement, être maximale lorsque x = 6, et devrait diminuer 
lorsque x s'éloigne de 6. Voici les probabilités pour quelques 
valeurs : 


Nombre d'oranges 
gâtées 


Probabilité 0,0002 0,0029 0,1208 0,2256 0,1208 0,0029 0,0002 


L'intuition suggère que chaque résultat se réalisera à peu près le 
même nombre de fois, soit à peu près 6 000 fois. 


10. 


11. 


15. 
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j)j En général, le polygone des fréquences pour ce type de variable est 
un polygone symétrique en forme de cloche. 


a) Ho : le nombre d'accouchements n'a rien à voir avec le jour de la 
semaine. 


H : les 300 accouchements se distribuent uniformément, c'est-à-dire 


selon les fréquences +, +, ..., +. 


50-42,86 )? 35-42,86)? 

co q'= CR, + CR 23 20, 

d) v=6; le point critique est donc 12,59. On ne rejette donc pas Ho : 
l'écart entre les effectifs théoriques et les effectifs observés peut être 


dû au hasard. 


x” = 4,67, avec 5 degrés de liberté. Cette valeur n'étant pas supérieure 


au point critique de 11,07, nous ne pouvons pas conclure que le dé est 
mal équilibré. 


1° = 22,67, avec 1 degré de liberté. La probabilité d'avoir un garçon est 


supérieure à la probabilité d'avoir une fille. 


Lorsqu'on dit que l'écart est très significatif, on affirme être sûr que la 
probabilité d'avoir un garçon n'est pas %. Mais on n'affirme pas que 


cette probabilité est très éloignée de !. 


x” = 132 avec 5 degrés de liberté. Les Orientaux ont des résultats 


nettement supérieurs à ceux des Américains. 


x°= 46,67 et nous concluons que le dé est mal équilibré. Cette 


conclusion contredit celle qui est tirée au numéro 6 avec les mêmes 

fréquences. Avec 36 lancers, les écarts entre les fréquences observées et 

les fréquences théoriques peuvent facilement se produire par hasard ; 
avec 360 lancers, les mêmes écarts sont très peu probables avec un dé 
équilibré. 

a) Bien que ce ne soit pas toujours le sens qu'on lui attribue, le terme 
« représentatif » sera considéré ici comme synonyme de « tiré au 
hasard ». L'hypothèse nulle est donc que l'échantillon a été tiré au 
hasard, auquel cas il devrait comprendre 20 % de blessures 
mortelles, 30% de blessures très graves, 30 % de blessures graves et 
20 % de blessures « pas graves ». 
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17. 


19. 


20. 


21. 


22. 


b) x” = 50. L'échantillon a été mal tiré. 


Une façon parmi d'autres de procéder : former les classes 10 000-19 999, 
20 000-29 999, .…., 90 000-99 999 et compter le nombre de numéros 
gagnants dans chacune. 4° = 1,25 avec 8 degrés de liberté, ce qui n'est 


pas significatif : on ne peut pas conclure que certaines classes de 
numéros ont plus de chances de gagner que d'autres. (En fait, la valeur 


observée de 4° est si petite qu'elle éveille de nouveaux soupçons : la 


distribution est trop uniforme.) La même hypothèse peut être testée en 
comptant le nombre de fois que paraissent chacun des chiffres O, 1, 2, 
.…, 9. Les effectifs théoriques sont 28,8 pour le chiffre O et 36,8 pour 
chacun des autres (rappelons que le premier chiffre ne peut pas être O). 
Les effectifs observés sont 6, 67, 61, 42, 31, 25, 29, 44, 29 et 26, ce qui 
donne y” = 72,07. Avec v = 9, la valeur critique est 16,93. L'hypothèse 
est donc rejetée. 


x” = 2,05 avec 1 degré de liberté. Les données sont conformes à 


l'hypothèse que l'échantillon a été tiré au hasard. 


2 


x” = 22,63 avec 9 degrés de liberté. Il y a une différence significative 


entre la population et l'échantillon en ce qui concerne la répartition selon 
le niveau et le sexe. 


2 


x” = 53,1 avec 6 degrés de liberté et c = 12,59. L'échantillon semble 


avoir été prélevé d'une manière telle que certains groupes d'âge ont été 
favorisés par rapport à d'autres. (Le problème soulevé ici est plus 
complexe qu'il ne paraît. Les chercheurs n'ont pas, en fait, prélevé leur 
échantillon d'une façon purement aléatoire : ils ont utilisé un mode 
d'échantillonnage appelé échantillonnage par grappes. Ce mode 
d'échantillonnage n'a pas les mêmes propriétés probabilistes que 
l'échantillonnage aléatoire simple et on ne peut pas, sans un examen 
plus approfondi, interpréter le résultat de ce test et expliquer la 
contradiction entre la conclusion tirée ici et celle du numéro 19.) 


x” = 175,91, avec 1 degré de liberté. L'échantillon est beaucoup plus 


scolarisé que la population. (Les auteurs du rapport signalent que leur 
échantillon a été prélevé en 1978 alors que le recensement date de 1971, 
et c'est à cela qu'ils attribuent la différence entre les proportions 
échantillonnales et les proportions de la population. Bien que ce facteur 
ait sûrement contribué à la différence, il est peu vraisemblable qu'il 
l'explique entièrement.) 


23. 


24. 


25. 


26. 


a) 
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4° =71,95 avec 6 degrés de liberté. Certains jours sont plus 


favorables aux suicides que d'autres. 


14” = 51,06 avec 1 degré de liberté. Les suicides sont moins fréquents 


à l'approche d'un week-end. 


1° = 1,96 avec 3 degrés de liberté. La fréquence des suicides semble 


être la même pour chacun des jours du lundi au jeudi. 


4° = 20,90 avec 2 degrés de liberté. Les jours du week-end ne sont 


pas équivalents les uns aux autres. 


14° = 59,38 avec 4 degrés de liberté. Le taux de défectuosité dépend 


bel et bien du jour de la semaine. 


1° = 0,163 avec 1 degré de liberté. Les taux de défectuosité du lundi 


et du vendredi sont égaux. 


2 


14° = 0,59 avec 2 degrés de liberté. L'hypothèse pourrait bien être 


vraie. 


1” = 58,68 avec 1 degré de liberté. Le taux de défectuosité est 


inférieur au milieu de la semaine. 


4” = 21,33 avec 1 degré de liberté. Les lecteurs emploient le 


détergent À avec une fréquence supérieure à celle de la population 
générale. 

1° = 1,43 avec 3 degrés de liberté. L'analyste saute aux conclusions 
un peu trop vite. 

1°= 27,1 avec 1 degré de liberté. Les absences sont réellement plus 


fréquentes lundi et vendredi. 


Les effectifs théoriques sont 129 ; 80,6 ; 80,6 ; 80,6 et 129. y” = 0,04. 


Le patron n'a pas raison de dire qu'il y a des abus. 


CHAPITRE 2 


1. 


Se EN 


a) x = 4,25 ; médiane = 4 ; mode = 4. 
b) x 
c) x = 4,875 ; médiane = 3,35 ; mode = 2,8. 


11,6 ; médiane = 11,2 ; chaque donnée est un mode. 


La médiane vaut 22 dans les 3 cas ; chaque donnée est un mode. 
a) Q,-1,Q, =3,0, =9. 

b) Q,-4,0, -6,0, =8. 

c) Q,=2,0,-2,0, =12. 

a) Q, =8,0, =16,Q, =24. 


b) x =0, Q =-10, 0, = médiane = 0, Q, =10. 


Numéro 1 : 

a) s2=2,562 5 ; s = 1,600 78. 
b) s2= 12,988 57 ; s = 3,603 97. 
c) s2= 5,269 375 ; s= 2,295 51. 
Numéro 2: 

a) s2=2;s=1,414 21. 

b) s2=44,56 ; s = 6,675 33. 

c) s2=50 ; s= 7,071 O7. 


s = 6,356 1 pour A et s = 1,414 2 pour B ; A est plus dispersé. 


s = 14,142 1 pour A et s= 12,664 9 pour B ; A est plus dispersé. 
s = 7,071 1 pour les deux séries. 


S = 7,071 068 pour A et s = 35,355 3 = 5(7,071 068) pour B. 


. Numéro 3: a) E=8. bE=8-4=4. c)jE=12-2=10. 


Numéro 4: a) E=16. b)E=20. 


16.5, =1,6125; S, = 1,095 4. 


17. 


18. 


21. 


22. 
23. 


24. 


26. 


28. 
29. 
30. 
31. 


32. 
33. 
34. 
35. 


36. 


37. 
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x=2,8,x° =9,2,5° =x° -x°? =9,2-(2,8) =1,36;s =1,166 2. Le mode est 2 ; 
la médiane est la moyenne arithmétique des nombres 2 et 3, soit 2,5. 


a) E=Q,-0,=9-5-4 b) E=Q,-Q, =16,9-5,4=11,5. 


Soit X la température en degrés Celsius. On a x = 18 et se = 25. Si Yest 


la température en degrés Fahrenheït, alors Y = 32 + 2 X. Donc 


p=32+2x-32+2(18)-64,4 et s° = (2) 5? = (2) (25)=81. 


5 x 


Z= 1. 


x = 8,s = 2. Les cinq cotes Z sont donc -1,5, -0,5, O0, 0,5 et 1,5. Ces cinq 
nombres ont, comme il se doit, une moyenne de zéro et une variance 1. 


Votre cote Zest 2,4. La proportion de la population dont la cote Zest, en 


valeur absolue, supérieure à 2,4 est au maximum à ne = 0,173 61 ce 


qui, dans une population de 100 000 représente 17 361 personnes. 


Si on prend la pondération basée sur des effectifs de 53, 70, 135, 350, on 
obtient une moyenne de 14 811 $ pour X et de 15 367 $ pour Y. 


Pour janvier, 2,564 6 ; pour juillet, 1,020 9. 

Mode = 1 ; médiane = 1. 

a), b) et c) sont fausses ; contre-exemple : 1, 2, 2,3 ; d) ete) sont vraies. 
a) Mode = 2 ; médiane = 3. 


b) Médiane = 3 ; le mode est probablement égal à 2, mais il est possible, 
quoique peu probable, qu'il soit égal à 4 ou à 5. 


Les températures à Montréal varient beaucoup plus. 
Le marché À a probablement des dépenses plus élevées. 
La variance est nulle ; l'écart-type aussi. 


Si l'écart-type de la population est 1, un score de 65 est impressionnant 
car il y a au plus 4 % de la population avec un score aussi éloigné de la 
moyenne. Si l'écart-type de la population est 20, un score de 65 est assez 
banal. 


Moyenne = 29 820 ; Médiane = 29 373 ; s = 14 436 ; O1 = 17 677 ; O3 = 
40 815 ; E = 23 138. 


L'écart-type de X est plus grand. 
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38. L'écart-type dépend de l'unité de mesure. Si, par exemple, X est la taille 


39. 
40. 


41 


42. 
43. 
44. 


45. 


46. 


en pouces et Y la taille en centimètres, alors Y = 2,54X et Sy = 2,54Sx. La 
cote Z, par contre, reste inchangée. 


À est mieux situé par rapport à sa classe que B par rapport à la sienne. 


Celui qui a eu 80 à l'intra a un meilleur résultat global. 


.Il serait raisonnable d'attribuer la baisse des recettes aux travaux 


municipaux car une cote Z de -5 est très significative. 

La proportion de bons rouleaux rejetés sera au maximum de 11,11 %. 
1 398 852,50 $. 

a) Pour les hommes : 9,832 2 ; pour les femmes : 5,837 3. 


b) La différence 9,832 2 - 5,837 3 = 3,994 9 n'est pas attribuable à une 
différence d'âge. L'âge joue en faveur des hommes. 


a) Hommes 7 111 $ ; femmes 3 864 $. Différence : 3 247 $. 


b) Hommes 6 920 $ ; femmes : 4 125 $. La différence 6 920 - 4 125 = 
2 795 $ ne peut être attribuée qu'à une différence de traitements, et 
non au fait que les femmes ont travaillé moins. 


a) Pour chaque tranche de revenu, le contribuable a payé moins en 
1974 qu'en 1973. 


b) Impôt moyen par contribuable : 1 057 $ en 1973 et 1 198 $ en 1974. 


CHAPITRE 3 


& 


vrai. b) vrai. 
c) faux : 9,9 % étaient des garçons et avaient un poids moyen. 


vrai. 


æ 


e) faux 12,8 % des bébés étaient des filles et avaient un poids moyen ; 
56,4 % (= Ÿ jdes bébés de poids moyen étaient des filles. 


0,227 


2: 1D) 
X Inférieur à 100 Supérieur ou égal à 100 Total 
Français 0,150 0,183 0,333 
Anglais 0,225 0,275 0,500 
Autres 0,075 0,092 0,167 
Total 0,450 0,550 1,000 


On vérifie que la fréquence d'une case est égale au produit de la 
fréquence totale de la ligne par la fréquence totale de la colonne. Par 
exemple, 0,150 = 0,333 x 0,450 ; 0,183 = 0,333 x 0,550, etc. 


3. a) Distribution marginale de l'âge de la mère : 


Âge de la mère 
Âge TOTAL 
19 et moins De 20 à 24 De 25 à 29 30 et plus 


Fréquence 0,116 0,356 0,312 0,216 1,000 


c) Distributions conditionnelles de l'âge de la mère : 


Âge de la mère 
Sexe TOTAL 
19 et moins De 20 à 24 De 25 à 29 30 et plus 


Masculin 0,117 0,356 0,312 0,216 1,001 
Féminin 0,115 0,357 0,312 0,216 1,000 


Tous 0,116 0,356 0,312 0,216 1,000 
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5. Distributions conditionnelles de la religion de l'épouse : 


Y : religion de l'épouse 


X : religion de l'époux | TOTAL 
Anglicane Baptiste Catholique Église Unie 

Anglicane 0,421 0,039 0,329 0,211 1,000 

Baptiste 0,120 0,510 0,216 0,154 1,000 

Catholique 0,123 0,024 0,707 0,146 1,000 

Église Unie 0,149 0,031 0,281 0,538 0,999 


On voit bien que les distributions conditionnelles sont très différentes 
les unes des autres. 


7. a) L'emballage rouge attire les acheteurs, mais seulement lorsque le 
produit est étalé au niveau des yeux. 


b) Quelle que soit la couleur de l'emballage, l'emplacement a un effet 
sur les ventes. Mais l'effet de l'emplacement est plus marqué lorsque 
l'emballage est rouge. 


8. Pour chaque tableau on peut calculer le pourcentage de femmes bien 
rémunérées (avec un salaire > 30 000 $) et le pourcentage d'hommes 
bien rémunérés. 


a) Les femmes sont favorisées dans les emplois techniques (80 % sont 
bien rémunérées comparé à 45 % pour les hommes) ; elles sont 
défavorisées dans les emplois administratifs (57 % pour les femmes, 
85 % pour les hommes). Lorsqu'on rassemble les deux tableaux, on 
constate que les femmes ne sont ni favorisées ni défavorisées (67 % 
pour les hommes et pour les femmes). 


b) Les femmes sont favorisées et dans les emplois techniques et dans les 
emplois administratifs. Globalement, elles ne sont ni favorisées, ni 
défavorisées. 


c) Les femmes sont favorisées dans les deux catégories, mais 
globalement elles sont défavorisées. La raison est qu'elles sont 
faiblement représentées dans les emplois administratifs où les 
salaires sont élevés. 


9. y” = 33 289. Cette valeur énorme est due en partie à la grande taille de 


l'échantillon et en partie à la très forte dépendance entre la religion de 
l'époux et celle de l'épouse. 


10. 4° 
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= 306,65 avec 6 degrés de liberté. Le taux de mortinatalité dépend de 


l'âge de la mère (Le taux croît avec l'âge, sauf pour les mères très jeunes 
(moins de 20 ans), pour qui le taux est supérieur à celui des femmes de 
20 à 29 ans). 


12. a) 


13. a) 


14. a) 


Voici le tableau des distributions conditionnelles : 


Classe 
Niveau TOTAL 
Supérieure Intermédiaire Inférieure 
Élémentaire 0,078 0,281 0,642 1,001 
Secondaire 0,107 0,309 0,584 1,000 
Collégial 0,130 0,352 0,518 1,000 


L'intention est sans doute de faire remarquer que, par exemple, on 
trouve plus de personnes de classe supérieure au collégial qu'au 
secondaire ou à l'élémentaire. 


Hypothèse nulle : le phénomène « drop-out » ne touche pas les 
enfants d'une classe plus que ceux d'une autre. Si cette hypothèse 
est vraie, il est raisonnable de supposer que la distribution des 
enfants selon la classe sociale est la même à tous les niveaux. 4° = 


22,62, avec 4 degrés de liberté. Ceci étant significatif, nous pouvons 
conclure que la distribution de la classe sociale varie selon le niveau : 
en général, il y a relativement moins d'élèves de classe sociale 
inférieure aux niveaux élevés. 


Le taux de renouvellement a été de 21 749/ (21 749 + 21 071) = 
50,8 % en janvier et de 4 733/(4 733 + 2 155) = 68,7 % en février. 
Donc, il y a une amélioration dans le taux de renouvellement. 


Voici les taux de renouvellement pour chaque catégorie. Catégorie A : 
janvier, 81,2 % ; février, 79,6 %. Catégorie B : janvier, 78,9 % ; 
février, 76 %. Catégorie C : janvier, 20,8 % ; février, 14,1 %. Dans 
chaque catégorie, il y a eu une baisse dans le taux de renouvellement 
alors que globalement il y a eu une hausse. Cette hausse globale est 
due surtout à une diminution disproportionnée d'abonnements dans 
la catégorie C, une catégorie où le taux de renouvellement est 
particulièrement bas. 


x” = 43,71 avec 2 degrés de liberté. Il y a des différences entre les 


trois groupes. 
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15. 


16. 


17. 


18. 


b) x° = 17,8 avec 1 degré de liberté. Ceux d'origine anglaise sont plus 


souvent bilingues. 


SAVON À : 4° = 0,128 avec 1 degré de liberté. Les annonces ne semblent 


pas avoir d'effet. 


CÉRÉALES B : 4° = 2,36 avec 1 degré de liberté. Les annonces ne semblent 
pas avoir d'effet. 


DÎNER CONGELÉ C : 4° = 4,09, avec 1 degré de liberté. Les annonces ont 
un effet : ceux qui voient les annonces sont plus portés à acheter le dîner 
congelé. 


La proportion d'acheteurs du produit a été de 1,5 % pour le groupe 
témoin et 3 % pour le groupe expérimental. La différence entre les deux 
est petite et n'aurait pas été trouvée significative avec un échantillon plus 
petit. Par exemple, si ces mêmes proportions avaient été observées avec 
des échantillons de 600, la valeur de 4” aurait été y” = 3,07, ce qui 


n'est pas significatif. 


ÉTAT MATRIMONIAL : 4° = 2,85, non significatif. Les lecteurs ne semblent 


pas être plus nombreux ou moins nombreux parmi les personnes 
mariées. 


SCOLARITÉ : y” = 3,09, non significatif. La tendance à lire les annonces 


ne semblent pas dépendre du niveau de scolarité. 


SEXE : 4° = 55,12, ce qui est très significatif. Les annonces publicitaires 
sont plus lues par les hommes que par les femmes. 


TAILLE DE LA FAMILLE : x = 0,453. Le pourcentage de lecteurs est le 


même, quelle que soit la taille de leur famille. 


x” = 130 avec 5 degrés de liberté. Les Orientaux ont des scores 


généralement plus élevés. 


Réglementation de la presse : 4° = 68,18 ; bibliothèques : 4° = 34,46 ; 
télévision : 4° = 30,99. Le nombre de degrés de liberté est 3 dans chaque 


cas. Les fondamentalistes ont tendance à favoriser la réglementation des 
journaux, le contrôle des livres dans les bibliothèques et celui des sujets 
traités à la télévision. 


19. a) 


20. b) 


21.a) 


c) 
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x” = 80,73 avec 1 degré de liberté. Le pourcentage de gens bilingues 
est nettement supérieur parmi ceux qui viennent de pays 
anglophones. 


2 


x” = 85,21 avec 2 degrés de liberté. Le fait d'être bilingue ou pas 


dépend du lieu de naïssance. 


x” = 0,79 lorsque l'échantillon est de taille 100 et 4° = 7,9 lorsqu'il 


est de taille 1 000. Pourtant le degré de dépendance est le même. La 
dépendance relativement faible observée dans l'échantillon peut être 
attribuée au hasard lorsque l'échantillon est petit mais pas lorsqu'il 
est grand. 


x” = 148,65 avec 2 degrés de liberté. Les distributions 


conditionnelles du statut du diplômé révèlent que le pourcentage de 
diplômés aux études est de 6,4 % parmi ceux dont le père n'a pas 
dépassé le secondaire et 12,1 % parmi ceux dont le père a dépassé le 
secondaire. 


1x” = 3,66 avec 1 degré de liberté. Ce n'est pas significatif. Il semble 
donc que le résultat significatif en a) réflète essentiellement le fait que 
le pourcentage de diplômés aux études n'est pas le même dans les 
deux groupes. 


x2 = 3 718 avec 3 degrés de liberté. La probabilité qu'un homme 
épouse une coreligionnaire dépend fortement de la religion. 


X2 = 6,73 avec 1 degré de liberté. La proportion de femmes baptistes 
qui épousent des coreligionnaires est supérieure à 50 %. 


x2 = 1,814 avec 1 degré de liberté ; nous ne pourrons donc pas rejeter 
l'hypothèse. 


23. Les distributions conditionnelles de Y étant donné les valeurs de X sont 
données dans le tableau suivant : 


X\Y A B C TOTAL 
5-9 0,522 0,403 0,075 1,000 
10-49 0,450 0,302 0,248 1,000 


50+ 0,516 0,172 0,312 1,000 
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24. 


25. 


26. 


27. 


28. 


29. 


Les compagnies de toutes tailles ont des problèmes de marché. Environ 
50 % ont fermé leurs portes pour cette raison. Pour les petites 
compagnies, les problèmes financiers sont sérieux et les problèmes 
d'opération ne le sont pas. Pour les grandes compagnies, c'est le 
contraire. Le test du y? poseraïit ici quelques problèmes d'interprétation : 
de quelle population ces compagnies sont-elles un échantillon ? 


X2 = 35,1 avec 1 degré de liberté. Les choses ont changé entre 1974 et 
1984 : significativement moins d'hommes baptistes, en 1984, ont épousé 
des non coreligionnaires. 


a) x? = 431,16 avec 4 degrés de liberté. Les francophones ont le plus 
grand pourcentage de diplômés aux études ; les anglophones ont le 
plus grand pourcentage au travail ; et les allophones ont le plus 
grand pourcentage d'inactifs ou au chômage. 


b) 2 = 95,50 avec 2 degrés de liberté. On rejette l'hypothèse. 


x? = 5,29 avec 1 degré de liberté. Il semble bien qu'il y ait une relation 
entre le type de prix gagné et le fait d'être premier-né. 


a) x? = 17,71 avec 4 degrés de liberté ; ce qui est significatif. En gros, 
ceux qui ont une scolarité élevée ont une forte tendance à être en 
faveur de l'avortement. 


b) Pour les catholiques, y? = 4,76 avec 4 degrés de liberté, ce qui n'est 
pas significatif. Pour les protestants, y? = 16,82, ce qui est significatif. 
La scolarité n'a pas d'effet sur les opinions des catholiques mais elle a 
un effet sur les opinions des protestants. 


a) %° = 1,35 avec 1 degré de liberté. Il n'y a aucune évidence d'une 


relation entre le cancer et le sommeil. 


b) x” = 16,37 avec 1 degré de liberté. Ceux qui souffrent de maladies de 
cœur ont du mal à s'endormir. 


a) x” = 10,85, avec 2 degrés de liberté. Les faiblement scolarisés vont 


plus souvent au Québec et moins souvent à l'extérieur du continent. 
b) Oui. Les faiblement scolarisés ont généralement un revenu plus 


faible, et il est possible que ce soit le revenu faible et non la scolarité 
faible qui explique pourquoi ils ont tendance à rester au Québec. 


c) Il faudrait prélever des données assez nombreuses pour pouvoir 
dresser un tableau comme celui qui est donné dans l'exercice, pour 
chaque niveau de revenu ; et un tableau qui montre le lien entre la 
direction prise et le revenu, pour chaque niveau de scolarité. Voici 
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des tableaux fictifs qui illustrent ce phénomène : 


Revenus faibles : 


Direction prise 


Reste du Canada Hors 
Scolarité Québec et continent continent TOTAL 
américain 
0-11 ans 150 75 25 250 
12 ans+ 150 75 25 250 
TOTAL 300 150 50 500 
Revenus élevés : 
Direction prise 
Reste du Canada Hors 
Scolarité Québec et continent continent TOTAL 
américain 
0-11 ans 20 40 40 100 
12 ans+ 80 160 160 400 
TOTAL 100 200 200 500 


Lorsqu'on rassemble les deux tableaux, on trouve qu'il y a une 


dépendance entre la scolarité et la direction prise. 


30. 4° = 2,192 68 avec 1 degré de liberté (test d'indépendance). 


x” = 2,192 99 avec 1 degré de liberté (test d'ajustement). 
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31.a) Cette procédure teste correctement l'hypothèse qu'Arthur a une 


chance sur 2 de faire une bonne prédiction. La conclusion du test est 
qu'Arthur a plus d'une chance sur 2 de faire une bonne prédiction. 
Mais il est incorrect de conclure de là qu'il a des capacités 
particulières de prévision du temps. Son taux élevé de succès vient 
du fait qu'il a tendance à prédire de la pluie souvent et qu'il vit dans 
un pays où il pleut souvent. 


b) Le test correct est basé sur le tableau suivant : 


De la pluie a Du beau temps 
Température TOTAL 
été prédite a été prédit 
Il pleut 70 30 100 
Il fait beau 30 20 50 
Total 100 50 150 
7 = 1,5. Il pleut aussi souvent lorsqu'Arthur prédit de la pluie que 


lorsqu'il prédit du beau temps. 


32. Parmi les scientifiques : 170 ; parmi les autres : 130. 


33.a) L'énoncé formel du problème traité au numéro 17 est le suivant : on 


dispose d'un échantillon de chacune de deux populations (les 
Orientaux et les Blancs), et on veut tester l'hypothèse que la 
distribution d'une certaine variable (le score au SAT) est la même 
dans les deux populations. C'est le test d'indépendance qui 
s'applique et qui est utilisé correctement au numéro 17. Le test décrit 
dans ce numéro et traité au chapitre 1, s'emploie dans les 
circonstances suivantes : on dispose d'un échantillon issu d'une 
certaine population fun échantillon d'Orientaux issu d'une 
population d'Orientaux) et on veut tester l'hypothèse que la 
distribution dans la population est donnée par certaines fréquences 
sf. f, (en l'occurrence, 0,045, 0,172, .…, 0,020). Le test décrit 


ici ne s'applique donc que si ces fréquences sont vraiment celles 
auxquelles on veut comparer celles des Orientaux. Mais ce n'est pas 
le cas, car on ne veut pas comparer les fréquences des Orientaux à 
celles des seuls 502 990 Blancs ; on veut les comparer aux 
fréquences réelles des Blancs de la population, et celles-ci ne sont pas 
connues. Elles sont estimées par les fréquences observées dans 
l'échantillon. 


b) 
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1° = 131,6, une valeur très proche de la valeur obtenue au numéro 


17. Dans la procédure décrite ici, nous comparons la distribution des 
Orientaux à une distribution supposée connue. Au numéro 17, nous 
la comparons à une distribution qui doit être estimée. Mais 
l'échantillon des Blancs étant très grand, la distribution estimée est 
très proche de la distribution réelle et les deux procédures sont alors 
très semblables. 


2 


X 


1 : les buveurs de B ne semblent pas faire la différence. 


2 


X 


9 : les buveurs de A font la différence. 


x” = 2,083 3 : il n'y a pas de différence significative entre les buveurs 
de A et ceux de B. 
Ne peut être testé avec les méthodes présentées dans ce chapitre. 


Cependant, puisque nous concluons en b) que les buveurs de A font 
la différence, c'est qu'il y en a une. 


CHAPITRE 4 


1. 


a) 26. b) 42. c) 6,87. La droite des moindres carrés est y = 3,1 + 
1,15x, et pour cette droite D = 6,41. 

y=14,45-0,71x 

La droite est horizontale : pour tout x, y = 6. 

Lorsque n = 2, il existe une droite qui passe par les deux points, et c'est 

nécessairement la droite des moindres carrés, puisque dans ce cas D= 0 

et que c'est la plus petite valeur possible de D. Si x1 = x, la droite de 

régression n'est pas définie (la pente est arbitraire). 

La droite des moindres carrés est y = 2,733 + 2,886x. Les }, sont, dans 

l'ordre, 5,619, 8,505, 11,390, 14,276, 17,162, 20,048. Les y, = sont 

0,381, 0,495, -1,390, 0,724, -1,162, 0,952. Leur somme est 

DE — }, )=0 et Sr, —}, f =5,103. On peut démontrer que l'égalité 

DE — }, )=0 est toujours vraie. 


a) Les points du nuage sont tous alignés le long d'une droite. 


b) La droite est y = 3 + 0,5x. Il n'est pas nécessaire d'employer le 
principe des moindres carrés ici. Il suffit de choisir 2 des 10 points et 
de déterminer la droite qui passe par les 2 points, en utilisant les 
méthodes de la géométrie analytique. 


c) L'équation correspond à la structure tarifaire typique des taxis : un 
montant fixe, plus tant du kilomètre. Ici, le montant fixe est 3 $ et le 
taux par km est de 0,50 $. 

On n'obtient pas la même droite en général. La droite des moindres 


carrés minimise la somme des carrés des distances verticales | PER 


; 
l'écart | Pie ÿ,| représente l'erreur commise lorsqu'on estime y, par y. 


Si on interchange X et Y, on se trouve à minimiser la somme des carrés 
des distances horizontales, c'est-à-dire les erreurs commises en estimant 
les x à partir des y. 


8. 


10. 


12. 


15. 


14. 


15. 


16. 


17. 


18. 
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y = -7,10 + 1,13 (5) = -1,45. Une note négative ne peut pas être 
considérée comme une estimation raisonnable. Le modèle que nous 
avons adopté, qui suppose que Ÿ est liée à X par une équation linéaire 
n'est pas correct à l'extérieur d'un certain intervalle des valeurs de X. 


= -0,96. 


Le coefficient vaut 1 ou -1, car la droite des moindres carrés passera 
forcément par les 2 points. 


. Puisque tous les points sont sur la droite, le coefficient de corrélation 


vaut 1. 


Les variables sont visiblement dépendantes. Mais r = 0. La dépendance 
n'est pas linéaire. 


Les valeurs de 2 + 4x sont : 6, 22, 34, 46 ; et les valeurs de 30 + 2y sont : 
56, 54, 48, 42. Le coefficient de corrélation est r = -0,96, la même valeur 
qu'avec les données originales (exercice 9). 


Si on échange X et Y dans la formule, on obtient la même formule. Donc 
le coefficient de corrélation ne change pas. 


L'échantillon {(1,3),(2,2),(3,1)}} donnera r=-1; 

L'échantillon {(1,1),(2,2),(3,3)}} donnera r= 1; 

L'échantillon {(1,1), (2,2),(3,1}} donnera r=0; 

L'échantillon {(1,1),(2,3),(3,3)}; donnera r = 0,87. 

Dans la population, le coefficient de corrélation vaut r = O. 

a) Z=0,53. b)Z=1,08. c) Z= 1,66. 

d) Z=2,31. e)Z=-1,08. f) Z=-3,06. 

Si nous prenons [Z | = 2 comme point critique, on peut déclarer que les 
variables sont réellement dépendantes seulement dans les cas d) et f. 


a) Z=0,76 b)Z=1,57. c)Z=1,85. d) Z=2,31. On peut conclure 
que les variables sont dépendantes seulement dans le dernier cas. 


a) Puisque c'est la scolarité qui peut avoir une influence sur les 
habitudes de lecture, et non l'inverse, nous prenons X = scolarité et 
Y = nombre de revues ou livres. 


b) r= 0,902. c) y = -3,28 + 0,588x. 
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19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


d) Z = 8,1, ce qui est très significatif. Nous concluons que le nombre de 
revues et livres lus dépend de la scolarité. 


a) r=0,904. b) y = 6,7 + 1,65x. 

c) } = 6,7 + 1,65(4) = 13,3 L/100 km. 

a) r=-0,88. b) y = 10,99 - O,017x. 

a) r=0,998. b) y=-194,34 + 343,8x. c) ÿ = 665,16. 

a) r=0,624. b)y=-2,32 +2,25x c) y =-2,32 + 2,25(118) = 263. 


d) Le nombre de plantules ne peut pas croître indéfiniment. 


a) r=0,737. b) y = 217,47 + 0,777x. c) Z = 4,37. Il semble bien y 
avoir une corrélation entre le poids et le taux de cholestérol. 


a) r = 0,897 ; Z = 10,76. Il semble y avoir une forte corrélation entre 
l'aptitude verbale et les ventes. 


b) Pour chaque groupe, le coefficient de corrélation est nul. Il ne semble 
donc pas y avoir de relation de cause à effet entre l'aptitude verbale et 
les ventes. Mais l'âge a une influence sur l'aptitude verbale et, parce 
qu'il a une relation avec l'ancienneté, il a aussi une influence sur les 
ventes. C'est cette influence de l'âge sur l'aptitude verbale et sur les 
ventes qui fait que ces deux dernières variables sont liées. 


La droite des moindres carrés est y = -14 + 1,3x pour le groupe A et 
= -29 + 1,2x pour le groupe B. Considérons un étudiant moyen, avec 
une note X = 60. Sa note en calcul est estimée par ÿ = - 14 + 1,3 (60) = 


64 s'il a suivi les cours de rattrapage ; et par ÿ = -29 + 1,2(60) = 43 s'il 
n'a pas suivi ce cours. On s'attend donc à ce qu'il ait une meiïlleure note 
en calcul s'il a suivi le cours de rattrapage. Ce cours est donc utile. 


a) r=0,67. 


b) y= 65,73 + 0,067x ; 65,73 $ devrait être à peu près le minimum que 
dépenserait toute famille, quel que soit son revenu. Après ce 
minimum, elles dépensent 6,7 % de leurs revenus pour la nourriture. 


c)_i) 75,78 $. ii) 99,23 $. 


d) i) 46,31 $. ii) 154,36 $. Les familles ne dépensent pas une proportion 
fixe de leurs revenus pour la nourriture. Les familles riches 
dépensent proportionnellement moins et les familles pauvres 
proportionnellement plus. 


27. 


28. 


29. 


30. 
31. 


32. 


33. 


34. 
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e) Si le revenu est 5 000 $ la droite de régression donne ÿ = 65,73 + 


0,067(5 000) = 400,73 $ ce qui est excessif. La droite est un modèle 
acceptable seulement pour un certain intervalle de valeurs de X. 


f Z = 3,25. On peut affirmer qu'il y a une relation entre les deux 
variables. 


r = 0,807, r2 = 0,65. Certains interprètent ce pourcentage en disant que 
l'aptitude en question est héréditaire à 65 %. 


b = 225 09/243 81 = 0,923. Au numéro 27 on aurait trouvé b = 0,834 et 
a = 2,44. C'est rare qu'on se permette de poser a = O. 


b) b'=-0,204 8, a = -2,315 8. 

c) a=e =0,098 7, b=-b', = 0,204 8. 

d)_y= 0,098 7e0:204 8225 = 0,062. 

b = 2,393 8. L'équation est y = x23%8, 

xy = 559 102/436 = 1 282,344 ; x = 6 868/436 ; 5 = 33 726/436 ; 
x? = 139 080/436 ; b = 0,901 2, a = 63,16. 


On peut tenter l'explication suivante : il n'y a pas vraiment de 
dépendance entre les deux variables. La corrélation positive observée est 
l'effet d'une troisième variable, l'âge, qui agit simultanément sur les 
deux. Les moins jeunes ont une dextérité manuelle et une aptitude 
mentale plus développées. Cette explication est vraisemblable mais pas 
certaine, car la corrélation calculée dans chaque classe est basée sur un 
nombre trop petit d'observations. 


Il suffit de remarquer la forme du nuage de points formé de ceux pour 
lesquels le score est supérieur ou égal à 50 - beaucoup moins bien 
alignés. Si les candidats qui se présentent ont des scores qui parcourent 
la gamme entière, alors le score au test sera un critère de sélection utile - 
comme l'indique le coefficient de corrélation de 0,95, et plus que ne laisse 
croire le coefficient de 0,46. 


La scolarité a un effet positif sur le libéralisme, mais cette dépendance 
s'estompe sous l'effet d'une troisième variable, la classe sociale. La classe 
ouvrière a tendance à être plus libérale, mais moins scolarisée. L'effet de 
classe -accroissement du niveau de libéralisme - est effacé par l'effet de 
la faible scolarité - baisse du niveau de libéralisme. 
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35. a) 


Pour les femmes, y = 5,17 ; pour les hommes, y = 5,82, une 


différence de 650 $, plus petite que pour les moyennes non ajustées. 
Donc même si l'on tient compte de leur niveau de scolarité inférieur, 
les femmes demeurent moins bien payées. 


Pour les femmes, y = 5,12 ; pour les hommes y = 6,00 ; une 


différence de 880 $, plus grande que la différence de 818 entre les 
moyennes non ajustées. Si les femmes n'avaient pas eu l'avantage 
d'avoir été engagées plus tard, elles auraient eu un salaire inférieur 
de 880 $ à celui des hommes. 


Pour les femmes, y = 4,927 + 0,002 1(100,93) = 5,14 ; pour les 


hommes, on peut s'en tenir à la moyenne non ajustée de 5,96, où 
calculer y = 5,964 - 0,000 1(100,93) = 5,95. Tout porte à croire que 
l'expérience ne joue pas un rôle important dans la détermination du 
salaire initial des hommes. 


La droite de régression pour les femmes est plus élevée que pour les 
hommes à gauche du point x = 3,74. On ne doit pas attribuer trop de 
signification à la droite de régression des valeurs de x trop éloignées 
de celles qu'on trouve dans l'échantillon. Donc, il demeure vrai que 
pour une scolarité donnée, les hommes sont mieux payés que les 
femmes. 


Pour les femmes, y = 5,16 ; pour les hommes, 5,86. Si les femmes et 


les hommes avaient eu une scolarité moyenne de 12,51 et une date 
d'engagement de 16,72, leurs salaires moyens auraient été de 
5 160 $ et 5 860 $, respectivement. La différence de 700 $ ne peut 
être expliquée ni par la différence de scolarité ni par la date 
d'engagement. 


CHAPITRE 5 


1. 


a) ‘{PPPP), (PPPF), (PPFP), (PFPP), (FPPP), (PPFF), (PFPF), (PFFP), (FPPF), 
(FPFP), (FFPP), (PFFF), (FPFF), (FFPF), (FFFP), (FFFF)}. 


b) {Libéral, Conservateur, NPD, autre réponse ou pas de réponse}. 


c) L'ensemble des nombres réels dans un intervalle raisonnable, par 
exemple, tous les nombres réels entre -30 et 45. 


d) L'ensemble décrit en c) pourrait convenir. 

e) {3, 4, 5, 6, 7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18}. 
f) {, 1,2, 8, 4, 5, 6, 7, 8, 9, 10}. 

g){Urbain, Rural}. 


a) i) La personne choisie est en faveur de la peine de mort pour le 
meurtre d'un policier mais pas pour tout meurtre. 


ii DU E=Q. 

b) CA. 

a) Non. La balle de golf étant plus grande qu'une bille, on a sûrement 
P(b) > PQ = P(). 

b) i) Vrai. ii) P(b) ne peut pas être égal à 1 à moins que P(j = P(v) = 0. 


iii) Nécessairement vrai. iv) Faux. v) Faux. vi) Nécessairement 
vrai, si on admet que P(v) = P(j. 


a) et b) sont inacceptables parce que la somme des probabilités de tous 
les résultats n'est pas égale à 1 ; c) est acceptable ; d) est inacceptable 
car l'une des probabilités est négative. 


À LU B= Q, l'événement certain. 

A N C: la personne choisie est une fille aux yeux bleus. 

A° : la personne choisie n'est pas une fille. A°=B. 

C N D: la personne choisie a les yeux bleus et les cheveux blonds. 


€ Nn D : la personne choisie a les cheveux blonds mais pas les yeux 
bleus. 


AN CN D: la personne choisie est une fille aux yeux bleus et aux 
cheveux blonds. 
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ERA 


10. 


11. 
12. 


15. 


14. 


15. 


A - 


D - 
D - 


D - 


a) 


a) 


C : la personne choisie est une fille qui n'a pas les yeux bleus. 


C : la personne choisie a les cheveux blonds mais pas les yeux bleus ; 
C=&n D. 


B : la personne choisie est une fille aux cheveux blonds. 
0,1. b)0,9. c)0,4. 
0,3. b)0,2. c) 0,6. 


P(P = 0,5 ; P(D) = 0,9 ; PF U G) = 0,57 ; PF N D) = 0,47. 


a) Aet B sont incompatibles et dépendants. 

b) Aet B sont incompatibles et dépendants. 

c) À et B ne sont pas incompatibles ni indépendants. À est 
sous-ensemble de B. 

d) A et B ne sont pas incompatibles. Ils sont presque certainement 
indépendants. 

e)] A et B ne sont ni incompatibles ni indépendants. À est sous- 
ensemble de B. 

f B=G.Aet B sont incompatibles. Ils sont indépendants car P(A n B) 
= PAAN D) = P() = O0 et P(A)P(B) = P(A)P(S) = P(A) x O = O. Et Best 
sous-ensemble de À. 

a) = L ) ET ° c) ee 6 ) ; €) : 

a) 0,9. b)O,1. c)0,2. 

a) X= le nombre de billes rouges. Les valeurs de X sont O et 1. 

b) X= le nombre de billes rouges. X = O, 1, 2,3. 

c) X = le nombre de femmes. X = 0, 1, 2,3,4 ; Y = le nombre d'hommes. 

d) X= la note de l'étudiant ; Y = son poids ; Z = son âge. 

p(0) = % ; pl) = 4 ; pl) = % ; Pp(8) = 4 ; p4) = % ; EX) = 2 ; 

Var(X) = 1. 

a) EX = 0, 10 $ ; Var(X) = 9,99. 


E(X) = 0,20 $ ; Var(X) = 19,96. 
E(X) = 1, 10 $ ; Var(X) = 1 008,79. 
E(X) = 2,20 $ ; Var{(X) = 2 015,56. 


16. 


17. 
18. 


19. 


20. 
21. 


22. 


23. 
24. 


25. 
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La probabilité de 1 est % et la probabilité de chacun des autres résultats 
est X. 
a) 3+l4+l425 b) 5()-1(5)=1,25$. 
a) i) E(8X + 9Y) = 600 ; Var(8X + 9Y) = 2 896. 
EX = ef) = 1,50 $ ; Var(X) = 1 (Var(X) + Var(X2)) = 50. 
P(A N B5 = PT(A L Bj4i = 1 - P(A LU B) = 1 - [P(A) + P(B)] = 0,3, ce qui 
contredit P(A° n Bd = 0,2. 
a) 2. b)2. c)4. 
Le =D 2606, 
P(Louis Lacasse brise 5 assiettes de suite) = en = 0,004, ce qui est très 
petit. Louis semble particulièrement maladroit. 
25 $. 
a) 3. b) ss. c) 0. 


15, 14 _ 7 10,15 _ 1 15 __ 3 
a) 25° 24 20° js DPÉERT T C) 25 5° 


d) Soit À : un garçon est choisi au |‘ tirage, B : un garçon est choisi au 
2° tirage. 
P(8)=P(4n8)+(P(4° n3)) 
= P(4)P(8| 4)+P(4° }P(81 4°) 
15 14 10 15 3 


X —+—Xx 
25 24 25 24 5 


Autre notation : 


P(garçon choisi au 2°) = P(GG ou FG) = P(GG) + P(FG) = = 


ua [u 


26.a) 3. D) Zu. ©) 5%. d) 5. 
27. Si K(1)-2(£)=0, alors K= 10 $. 


28. a) 


6 


2 13 
ds: DJS 


29.a) 0,6. b)0,7. c) 0,46. d)0,45. e) 0,4. 
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30. p(1)= 3; p(2)= +: p(3)= 5 p(4)= +5 E(X)=2. 


31. p=%4. a)£. bji4; ijO. üÿO. iv 1. v) 2. 


3 


32. E(X) = 896 ; ©, = 44,9. 
33. E(X) = 672 ; ©; = 240. 

34.0 ; 240. 

35.a) EX =9$; Var(X) = 12 544. b)i) 25 088$. ii) 50 176 $. 
36. 2,857 %. 

37. p. 


CHAPITRE 6 


1. 


2 
3. 
4 
5 


a 


10. 


11. 


a) 120. b)5040. c) 40 320. d) 3 628 800. 
a) 10. b)35. c) 126. d) 4950. e) 499 500. 
51-120. 
61-720. 


U ] = 56. On peut affecter 3 personnes à 3 postes de 3 ! = 6 façons. 


18 424. 


ei = 462 façons de former le premier groupe et a = 462 façons de 


former le deuxième groupe. Ces deux nombres sont nécessairement 
égaux puisque à chaque façon de former un premier groupe il correspond 
exactement une façon de former le deuxième. Plus généralement, le 
nombre de façons (" de choisir x personnes pour le premier groupe est 


égal au nombre de façons on ] de choisir les n - x façons de choisir ceux 


qui appartiennent au second. 


a) = { (FFFFF), (FFFFP), (FFFPF), (FFPFF), (FPFFF), (PFFFF), (FFFPP), 
(FFPFP), (FPFFP), (PFFFP), (FFPPF), (FPFPF), (PFFPF), (FPPFF), 
(PFPFF), (PPFFF), (PPPFF), (PPFPF), (PFPPF), (FPPPF), (PPFFP), 
(PFPFP), (FPPFP), (PFFPP), (FPFPP), (FFPPP), (PPPPF), (PPPFP), 
(PPFPP), (PFPPP), (FPPPP), (PPPPP) }. 


x 0 1 2 3 4 5 


p(x) 1/32 5/32 10/32 10/32 5/32 1/32 


e) PIX = 2) = (; (4) (2) - 0,820 2. 
b) P(X> 3) = P(X = 3) + P(X = 4) + PX=5) 
= 0, 164 6 + 0,041 2 + 0,004 1 = 0,209 9. 


a) O0, 153 6. b) 0,041 2. c) 9 x 10% - cette probabilité est 
approximative car les tirages ne sont pas indépendants. 


a) _p(0) = 0,062 5 ; p(l) = 0,25, p(2) = 0,375, p(3) = 0,25, p(4) = 0,062 5. 
b) P(X> 3) = 0,312 5. 
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12. 


15. 
14. 
15. 


16. 


17. 


18. 
19. 


20. 
21. 
22. 
23. 
24. 
25. 
26. 
27. 
28. 


29. 
30. 


31. 


Ne GUY e. dou 3 (10 SC 


1 024 3 /1024° 
) 0,0729. b) 1- (0, 1}5 = 0,999 99. 

a) 1. b) 0,070 2. 
) 
) 


a) EX = 5/4, Var(X) = 0,863 97. 
b) PX=1)=0,41142. c) PX> 2) = 0,367 047. 
. 

a) EX = 13, VarX) = 3,313 73. 


b) Oui, car 17 est à plus de 2 écarts-types à droite de LH. 
P{(0) = 0,071 4 ; p(l) = 0,428 6, p{2) = 0,428 6, p(3) = 0,071 4. 


Probabilité qu'ils aient 4 enfants : 0,062 5 ; 4 enfants ou plus : 0,125. 
L'espérance du nombre d'enfants est 2. 


0,046 5 ; 0,279 1. 

0,197 5. 

0,021 255 8. 

À =5; PAX24)=1-PX=0)-PX=1I - PX= 2) -P(X-3) = 0,735 O. 
a)0,234 375. b) 0,227 656. c) 0,224 414. d)0,224 079. e) 0,224 042. 
0,104 8. 

a) 0,1009. b)0,1236. c)0,2959. d) 0,170 8. 

0,694 3 ; 0,000 77. 

a) E(X) = 18,75, Var(X) = 4,687 5. 

b) = - 4,04 ; sa théorie est très peu vraisemblable. 

a) 0,216. b) 0,069 48. c)1,5. 

a) un =1,2; 6° =0,980 17. b)0,2645. c) 2,645. 


PIX > 2) = 1-1" -j_("1)) Avec n = 6, PIX > 2) = 0,890 625 et avec 


2. 28 1 
n=7, PX2>2) = 0,937 5. Le couple doit donc avoir au moins 7 enfants. 
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32.a) La probabilité qu'il ait 4 enfants est la probabilité que, après le 
premier, il doit avoir 3 enfants pour avoir un enfant de sexe différent 
du premier. La probabilité est donc (7)(/)7" = 0,125. 


b) 0,25. c) w = 3, a° =2. 
83. 0,826 7. 
34. p(4) = 2(%)° = 0,125, p(5) = 2(4 (4) = 0,25, p(6) = 2(10)(4)° = 0,312 5, 


p(7) = 2(20)(%) = 0,312 5 ; EX) = 5,812 5, E(X) = 34,812 5, Var(X) = 
1,027 34. 


35.a) 0,150 3. 
b) E(X = 300, Var(X) = 210, écart-type = 14,49. 


c) La valeur X = 250 correspond à une cote Z de -3,45, ce qui est 
excessif. Le pourcentage de gens en faveur de la peine de mort est 
vraisemblablement inférieur à 30. La valeur X = 315 correspond à 
une cote Z de 1,04, ce qui est conforme aux hypothèses initiales. 


d) Avec n = 10, la valeur X = 4 correspond à une cote Z de 0,69, ce qui 
n'a rien d'exceptionnel. Avec n = 1 O00, par contre, la valeur X = 400 
correspond à une cote Z de 6,9, ce qui met en doute les hypothèses 
initiales. 

36. 
P(x> b|x>a) = P(x> bet x> a)/P(x> a) 


=P(x> b)/P(x> a) 


(D } (Le pe 
(= p20" 6 
=P(x > b- a). 


37.a) Il est raisonnable de supposer que l'espérance du nombre de buts 
comptés par À est la moyenne de deux moyennes : le nombre de buts 
comptés par A et le nombre de buts subis par B. Donc (4 + 3,2)/2 = 
3,6. Pour B, par le même raisonnement, on a (3,8 + 3,6)/2 = 3,7. 


b) (e-3,6/3 ) (e-3,7/3) = 0,087 74. 


-3,6/3 3.6/3 2 
c) ( Î ) = 0,216 9. 
2! 
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38. 


39. 


40. 


41. 


42. 


43. 
44. 


45. 


46. 


47. 


d) L'espérance du nombre total de buts comptés durant la partie est 3,6 
+ 3,7 = 7 3. P(6 buts ou plus) = 1 - p(0) - … - p(5) = 0,736 O. 

e) (1-e3:7/3)3 = 0,355 9. 

a) 4000. 


b) La valeur X = 5 correspond à une cote Z de 0,52 si k = 5 000, 4,03 si 
k = 20 000 et -3,95 si k = 1 000. Seule l'hypothèse que 4 = 5 000 est 
vraisemblable si on observe X = 5. 


u = 60, o° = 300. 

u =14,7, © 38,90. 

a) u = 100, o° =50. b) u = 2,857, o° =2,4490. c) u=%,0° =. 
d) u=350,0  =291,67. e) u=3,25,0o° =1,86397. f) u=36,0  =1 260. 
g) u=216,©° =46 440. 

a) E(X) = 750, Var(X) = 625, © = 25. 


b) La valeur X = 722 correspond à une cote Z de -1,12, ce qui ne permet 
pas de conclure que le dé est mal équilibré ; la valeur X = 822 
correspond à une cote Z de 2,88, valeur assez grande pour permettre 
de conclure que le dé est mal équilibré (le résultat « 6 » a une 
probabilité supérieure à ). 


0,022 3. 


En regroupant les deux dernières cases on obtient 7” = 30,3, ce qui, 


avec 3 degrés de liberté, est hautement significatif. 


En groupant les deux premières cases (X = O et X = 1) on obtient 
2 


14° = 0,58, ce qui, à 6 degrés de liberté, n'est pas significatif. Nous 
acceptons l'hypothèse que X est de loi de Poisson avec À = 4. 


Sous l'hypothèse que le magicien n'a pas de pouvoir de perception extra- 
sensorielle et ne triche pas, la probabilité d'avoir 10 succès ou plus en 12 
essais est de 7,86 x 107. Le magicien utilise certainement un truc. 


S'il est impossible de répondre sans avoir lu le texte, la probabilité d'avoir 
8 bonnes réponses ou plus est 0,032 1. La conclusion est que les 
réponses offertes donnent un indice qui permet d'augmenter les chances 
de succès. 


48. 


49, 


00. 


o1. 


52. 


93. 


04. 
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La probabilité d'un nombre aussi élevé de décès le jour de l'anniversaire 
est 0,013, assez petite pour permettre de croire que les conjectures sont 
vraies. 


a) i) 7,51. ü) 10,44. 
b) p<0,205 7. 


c) n=5,p< 0,275 ; n = 10, p < 0,206 ; n = 30, p < 0,107 ; n = 50, 
p<0,075 ; n = 100, p < 0,045. 


a) 5. b)|X-6| >5) = PX> 11) + PX< 1) = 0,014 5. 


c) Un écart aussi grand que 5 est peu probable sous l'hypothèse que 
p = 0,4. On doit donc considérer cette hypothèse comme peu 
vraisemblable ; il est plus plausible que p soit supérieure à 0,4. 

d) Sous l'hypothèse que p = 0,4, E{X) = 6, Varx]) = 3,6 et Z = . = 


2,64. Ceci confirme que la valeur X = 10 est trop éloignée de E(X) 
pour que la valeur p = 0,4 soit vraisemblable. 


La probabilité, calculée par la loi hypergéométrique, d'avoir si peu de 
femmes est 0,013 4, ce qui veut dire que si les choix sont faits au 
hasard, un nombre aussi petit de femmes parmi les candidats choisis est 
très improbable. Ce déséquilibre ne devrait normalement pas se 
produire. On ne prétend pas que la compagnie qui engage des employés 
doive le faire au hasard : la logique de ce calcul est que si les critères de 
sélection sont indépendants du sexe, le nombre de femmes engagées 
devrait dépendre uniquement du hasard. La conclusion est que les 
critères de sélection ont effectivement quelque chose à voir avec le sexe. 


La probabilité que 8 personnes ou plus soient atteintes de ce cancer est à 
peu près de 0,001 1. Cette probabilité étant si petite, nous pouvons 
difficilement attribuer ce grand nombre de cas au hasard. 


P(1Z| 22) = PX2 8) + PX< 0) = 0,0183 ; PF(|Z] > 3) = PIX > 9) = 0,00 17. 

D'après l'inégalité de Tchebychev, P([Z| > 2) < 0,25 et P(|Z| > 3) < 

0,111 1. 

a) P(X = 0) 0,006 7 si À = 5, ce qui rend cette valeur de À très peu 
plausible. 


b) P(X= 0) = 0,367 9 si À = 1, ce qui rend cette valeur de À entièrement 
plausible. 


c) À <3,00. 
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55.a) 0,1205. b) 0,423 2. 


c) On rejettera le lot si la plaque tirée a 4 défauts ou plus. La probabilité 
de rejeter un lot acceptable devient alors 0,033 8. 


56.a) 0,538 6. 


b) (0,94)x < 0,01 & x > log 0,01/log 0,94 = 74,4. On déclarera que la 
population est satisfaisante seulement si les 75 premiers comptes 
tirés sont sans erreur. 


CHAPITRE 7 


200% Is 70 


a) Non, S=c. b) Oui. c) Oui. d) Oui. e) Oui. f) Oui. 
g Non, fx) <0 si = <x<1. h) Non, S= 12/10 +1. 
a) O0. b) Z. c) Z. d)0,3. e)0. f) 0,05. 


a) 0,5. b)0,405. c) 0,4 d)0,5. d) 0,097 222. #0. g)0,25. h) 
0,52. 


a) 0,8. b)0,2. c)0,2. d)0,6. e)0,8. f0,5. g)0,577. h) 1. 
i) Selon Tchebychev cette probabilité est supérieure à 7. 
a) 0,367 88. b) 0,367 88. c) 0,082 08. d) 0,904 84. e) 0,822 75. 
f) 0,993 26. g) 0,993 26. h) 0,750 65. 
0,095 16. b) 0,070 50. c) 0,049 787. 
0,035 67. b) 0,964 33. c) O, 153 518. 
0,082 08. b) 0,015 33. 
0,158 7. b)0,6826. c) 0,950 0. d) 0,477 2. e) 0,001. f) 0,799 4. 


a 


2e, 


8 


eg) 0,030 1. h)0,539 8. i) 0,009 8. j) 0,010 8. 

a) 0,8413. b) 0,6826.  c) 0,6730.  d) 0,0228.  e) 0,977 2. 
# 0,5319. g)0,0006. h)1. i)0,9500. j) 0,085 5. 

.a) 1,282. b)2,326. c) 1,645. d)2,576. e)-2,326. f)-1,282. 

e) 2,576. h)3,291. i)0,126. ji) 1,96. 


D 


19,30. b)15,13. c) 7,84. d) 6,58. 


0,521 9. b) 0,521 9  c) 0,057 9.  d) 0,006 2. e) 0,016 9. 
f 0,016 9. 


D 


— <— 


. En considérant la note comme une variable discrète ne pouvant prendre 


que des valeurs entières, on obtient : 


A:222%;B:289%;C:254%; D:17,7 %,;E : 10,9 %. 
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15. 


16. 
17. 
18. 


19. 
20. 
21. 


22. 


23. 


24. 
25. 
26. 


a) 0,6826. b)0,9544. c) 0,997 4. 


d) Le théorème de Tchebychev dit qu'à moins de deux écarts-types on a 
au moins 75 % de la population et à moins de 3 écarts-types on a au 
moins 89 %. (Il ne dit rien sur le pourcentage d'individus à moins 
d'un écart-type de la moyenne.) 


a) Z=2. b)0,0228. c) 0,954 4. d) 0,006 2. 
a) 0,026 2. b) 0,026 2. 


a) 0,025 6. b) 0,974 4. c) 0,857 7.  d) 0,807 6. e) 0,172 6. 
f 0,123 5. 


0,017 9. 
c= 0,08. 

a) 0,3196 0,8121 0,2195. 
b) 0,3336 0,8064 0,236 8. 
c) 0,3233 0,7218 0,180 4. 


Soit X, X2, X3 et X, les forces de rupture des 4 câbles. Nous supposons 
que pour que tout aille bien, il faut que la force de rupture totale des 4 
câbles soit supérieure à 7 900 kg. P(X1 + X2 + X3 + X4 > 7 900) = P(N(O,1) 
> -2,9) = 0,998 1. Une autre interprétation du problème est la suivante : 
puisque chaque câble supporte un quart de la charge totale, soit 7 900/4 
= 1 975 kg, il faut que la force de rupture de chacun des câbles soit d'au 
moins 1 975. La probabilité est donc 


(P(X > 1 975))* = (P(N(O,1) > -1,45))* = (0,926 5)+ = O, 736 9. 
X est Hpg(13,12,40). a) P(X = 4) = 0,213 15. 

b) y =3, o° = 1,764 7, HX= 4) = 0,293 9. 

a) 0,149 8 b)0,0376. c)0,0136. d) 0,003 2. 

PX>5)=e"" =0,2. -5/0 =log(0,2). 0 = -5/ log(0,2) = 3,106 67. 
a) 80 plants par rang. b) 100(0,8)(0,2) = 16. 

c) PX> 85) = P(N(O,1) > (85,5 - 80)/4) = P(N(O,1) > 1,375) = 0,084 6. 


d) P{X < 70) = P(N(80,16) < 69,5) = P(N(O, 1) < (69,5 - 80)/4) = P (NO, 1) < 
-2,625) = 0,004 3. 


e) 20 000(0,004 3) = 86. 


27. 
28. 


29. 
30. 


31. 


32. 


33. 


34. 


b) 
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P(X > 100) = P(N86; 85,63) > 100,5) = P(N(O,1) > 1,57) = 0,058 2. 
0,006 2. b) 309,30. 
0,017 9. b)0,0162. c) 0,080 6. d) 0,025 5. 
722. f) 481. g) 752. h) 752. 
0,312 1. b)0,420 7. c) 0,321 1. 
X = SU + 10V où U est le nombre de faces avec les pièces de 5 & et V 


est le nombre de faces avec les pièces de 10 €. Uest B(20, 3) et Vest 
B(10, +). E(X) = 5(10) + 10(5) = 100 €. Var(X) = 25Var(U) + 100 Var(V 
= 25(5) + 100(2,5) = 375. 


Les valeurs possibles pour X sont des multiples de 5. P(X > 116) = 
P(X > 117,5) = P(N (0,1) > 0,904) = 0,183 O. 


Si on commence par acheter un litre, le coût de la peinture sera de 6 $ 
seulement avec probabilité 0,308 5, et 12 $ avec probabilité 0,691 5, ce 
qui donne une espérance mathématique de 10,149 $. Ceci est préférable 
au coût certain de 11 $ qu'on devrait payer si on achetait le format de 2 
litres. 


X est B(20,; 0,5) = N{10; 5). 
Yest B(20; 0,6) = N12; 4,8). 


Y- 


X est approximativement N{2; 9,8). 

P(X > 13,5) = 0,058 8. 

PX> "= PY-X<0)=P(Y-X<-0,5) = 0,212 3. 
P(Y > X)= PY-X>0)=P(Y-X> 0,5) = 0,684 1. 
P(X = Y) = P(Y- X= 0) =0,103 6. 

E(X) = 12(3,5) = 42, Var(X) = 12(35/12) = 35. 
P(30,5 < X < 49,5) = P(-1,94 < Z< 1,27) = 0,871 8. 


P(3,0 < X < 4,0) 
: r| \n(3,0-3,5) us eee = 0,9 


35/12 35/12 
Vn(4,0-3,5) 
-n = 1,645 


> n =32. 
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35. 
36. 
37. 
38. 


39. 


40. 


41. 


42. 
43. 
44. 


a) 0,2612. b)0,5844. c) 0,154 4. 
0,975. 
a) 0,9582. b)0,0110. 


Si X est la durée de vie d'un appareil, ce résultat montre que la 
probabilité que l'appareil dure encore un an sachant qu'il a déjà duré 
deux ans est égale à la probabilité qu'il dure un an quand il est neuf. 


a) 39,35. 


b) La probabilité d'avoir 40 pièces ou plus à remplacer est 0,488 O. Il n'y 
a donc aucune raison de douter que la durée moyenne est de 2 ans. 


a) 0,057 1. b)0,4296. c)n=107. d)0,057 1. 
e) On rejette le lot si X < 197,06 ml. 


0,049 8 ; bien plus petit que la limite de } donnée par le théorème de 
Tchebychev. 


a) 0,022 8. b) 0,034 OC. 
Nous devons prendre un échantillon de taille 62 ou plus. 
a) i) 0,161 1. ïi) 0,264 8. 


b) On acceptera un rouleau si et seulement si sa longueur est 
supérieure ou égale à 65,02 mm. 


c) 0,508 0. 


CHAPITRE 8 
1. E(X) = 6, Var(X) = 0° ; donc E(X) = EX) =0 et 
Var X)= VarX)/n=0° /n. 
2. E(X) = À, Var(X) = À ; donc E(X) = E(X) = À et 
Var X)= VarX)/n= à /n. 
3. a) Æ6)-EÆX)=u,.EÆ62)=(h,;+u,)/2=h,. 
E(,)=su, -4u, =u,. 
b)_Var(6,) = Var(xi) = 6°. 
Var, }=(} (2 +02 )=0 2/2. Var, ]=5°02 +(-4) 0° = 4102. 
L'estimateur le plus précis est o, . 
4. P(0-0,2 < M6, =) < 0 + 0,2) = P(- 2 < N(0,1) < 2) + 0,954 4. 
5. p= 0,060 ; c, = 1,645 ; (0,037 ; 0,083). 


6. Ên= 1,960. Pour A, (0,380 ; 0,440) ; pour B, (0,313 ; 0,371) ; pour C, 
(0,061 ; 0,095) ; indécis, (0,147 ; 0,193). 

7. c, = 1,960 ; (0,270 + 0,042) = (0,228 ; 0,312). 

8. c, = 1,645. Blancs, (0,435 ; 0,521) ; Noirs, (0,247 ; 0,325) ; nulles, 
(0,199 ; 0,273). 


r=0,10 r= 0,05 r= 0,02 r= 0,01 
a =1% 166 664 4147 16 589 
a =5% 96 384 2 401 9 604 
a = 10% 68 271 1 691 6 765 


ODA ESS IPN = ST = lTore 15e dre, 129% (130:250) 
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11. c, = 1,960 ; (5,96 ; 6,30). 


12. X = 93,1; 6° =63,21;v=9; ec = 1,833 ; LC. = (88,5 : 97,7). 


13. Marque A : VE 3,42 560: =10,89; c0=1,796; 10 =6,22;3;:02); 


Marque B : '— 4,16; 6 = 0,82 ; c, = 1,895 ; I.C. = (3,61 ; 4,71). 


Marque C : N=402;6 =104; Ce 


6,314 ; I.C. = (0 ; 8,66). 


Marque D : X =2,95; 6 = 0,53; = LOST e (27953 TL): 

14. =X=4,7; 6: = À/n = 0,0472 ; c, =1,960; I.C. = (4,29; 5,15). 

15. a) 6: = npq | p° = ng/p;5; =ngl/p; I.C.= (itc,e.) 
b) X=25;p=%; ñ=150. 6° =750;c, =1,645; I.C.= (105 ; 195) 


2N,(300-N, ) 
9x299 


16. X est Hpg(200, M, 300 - M) ; E(X) = 2N/3 ; Var(X) = 
2 SC n À 
N, = 3X/2; se =N, (G00-*. | 598. 
Avec X = 106, on trouve N, = 159 et 5; = 6,12; c, = 1,645; 
1 


I.C. = (149 ; 169). 


17. E(X) = 0/2 ; Var(X) = 0°? /12 ; E(O) = 20/2 = 0 ; Var(@) = 4VarX) 


19. (se <X <(1-2Db})=1-a; PL <1<(i-2)1)=1-0. 


20. X est N{u,%): P(X-1<u<X+1)=Pl-n/2<N(01)<4n/2) 
Avec n = 4, 16 et 36 on obtient 68,26 %, 95,44 % et 99,74 %. 
21.a) E(0)= cE(0,) + (1- QE(6,) = @ + (1 - d0 = 0. 


b) 6°=c'6: +{1-c) 6° ; 
6 6, é, 


22. 


23. 


24. 
25. 


26. 


27. 


28. 
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a) 0=""7. 


b) Var(6 )- (es) Var(Y)= ee <®° sin>2. 


(n+2) 3n 


Soit X le nombre total de points. E{X) = 7n/2 ; Var(X) = 35n/12. 
ñ = 2X/7; 6: = 5n/21 ; 6° = 5ñn/21. Avec ©, = 1,645 et X = 117, on 


trouve ñ = 33,43 ; 4. = 7,96 ; I.C. = (28,8 ; 38,1). 
p = 100/360 ; n = 360. Avec a = 0,05, I.C. = (0,23 : 0,32). 


Pour 100 000 paquets, le profit est de (400 - u) x 30 $. Les bornes de 

l'I.C. pour LH donnent, pour le profit, l'I.C. (14,13 $ ; 78,87 6). 

Avec l'ancienne peinture, le coût moyen par panneau est de 3,00 $. 

a) Avec la nouvelle peinture, Nr = 058815 6 = 007: Ve 90e 
2,262 ; I.C. = (0,583 + 0,032) = (0,551 ; 0,615). 

b) Coût moyen par panneau : I.C. (2,48 $ ; 2,77 6). 
Épargne moyenne par panneau : I.C. = (0,23 $ ; 0,52 $). 

c) Épargne pour 2 000 panneaux : I.C. = (460 $ ; 1 040 $). 


a) p,=0,380;6; = 0,000 7 ; & = 1,960 ; I.C. = (0,248 ; 0,852). 
h 
P, =0,20;6; =0,001 6 ; & = 1,960 ; I.C. = (0,122 ; 0,278). 
3 f 
b) p=0,493p, +0,507p, =0,2493. 
6,=(0,493) 6; +(0,507) 0 °p,: 
ge = (0,493) 0,000 7 + (0,507) 0,001 6 = 0,000 58. 
I.C. = (0,249 3 + 0,047 2) = (0,202 1 ; 0,296 5). 
a) ZW. =36; ZW” =284; W=2,4; GES = 0,94 ; v=14; c =1,761. 
LC. = (2,4 +1,7) = (0,7 ; 4,1). 
b) Y=42,2; Y =39,8: 62 =9,94; 6 ? =9,93 ; 0 =2,4; 6 2 +6 2 =19,87. 
X Y X Y 


L'écart-type est environ 4,6 fois trop grand. X et Ÿ ne sont pas des 
variables indépendantes. 


X = 398,45 ; 6 = 2,305 ; v = 19 ; c, = 2,098. I.C. pour u : (397,371 ; 399,529). 


CHAPITRE 9 


l::D=0,95; 2e = 099222:,27=.-2,962; 6 = 1,960. '[Z| + %.; donc 
l'hypothèse nulle est rejetée. 

2 Sipest la probabilité qu'André gagne, on teste l'hypothèse p = % ; p= _ 
= 0,60 ; Z = 1,10 ; c, = 1,645 ; |Z] < ©, ; donc on accepte l'hypothèse 


qu'André et Bernard sont de même force. 


- u \-1/21 
3. a) P(accepter l'hypothèse nulle) = P (Es < 1,645) 


= P(-2,88< N(0,1)<0,38)= 0,646 0. 
Donc Pfrejeter l'hypothèse nulle) = 1 - 0,646 O = 0,354 O. 
b) La probabilité de rejeter l'hypothèse nulle est P = 
p[Van FEAË 1,645). 


Pour rendre le problème plus traitable, nous éliminons les valeurs 
absolues dans |p-/|, ce qui est une approximation permise 
puisque, avec la valeur de n que nous allons trouver, la probabilité 


que p prenne une valeur inférieure à /—1,645/ Van est négligeable. 


= —1,282 = Vn =73,149 > n25 351. 


10. 


11. 
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On peut maintenant vérifier aisément qu'avec n = 5 351, la probabilité 
de rejeter l'hypothèse nulle lorsque p = 0,52 est effectivement 
d'environ 90 %. 


Py =0,4286; p, =0,6389; Z=-1,71; c, =1,645; |Z|>c, ; donc on con- 


clut que oui, les jurys ont une plus forte tendance à trouver coupables 
ceux qui sont accusés d'avoir victimisé des Blancs. 


D, =0,2041; p, =0,1489; Z =0,836 ; c, =1,960 ; [Z|<1,960 ; donc on ne 


peut pas conclure qu'il y a une différence réelle entre les étudiants nés 
au Canada et les étudiants nés ailleurs. 


P, =0,0333; p, =0,037 5; Z =-0,296. La différence n'est significative à 
aucun niveau raisonnable. 

p=0,60; p=0,5; Z=1,01; c, =1,282. Puisque |[Z| < 1,282, nous ne 
pouvons pas conclure que le somnifère a un effet. 


36 personnes n'ont vu qu'une couleur (25, le jaune et 11, le rouge). Ho: p 
= +, p=+ = 0,694 4; n = 36; Z= 2,33 ; c, = 1,960 ; Ho est rejetée. Le 


jaune est mieux vu que le rouge. 
X =38,925 ; © =10,64 ; u,=45; T=-2,55; v=19; c, =2,093. |T|>2,093, 


donc l'affirmation de la revue n'est pas vraisemblable. Les lecteurs de 
cette revue ont un revenu moyen inférieur à 45 000 $. 


X =100; v=8; pu, =95. 
a) © =20,25 ; T =3,333. L'hypothèse est rejetée. 
b) 6,=750 ; T =0,548. L'hypothèse n'est pas rejetée. 


c) Lorsque la variance est grande, un écart de 5 n'a rien d'étonnant et 
ne mène pas au rejet de l'hypothèse ; lorsque la variance est petite, 
par contre, un écart de 5 ne peut pas s'expliquer par le seul hasard. 


X =13,80 ; o, =4,384 ; Y =11,97 ; 6, =4,533 Nous supposons les 


variances égales. 6 = 4,477 ; T = 1,43 ; v = 50 ; ©, = 2,01 ; |T| < c.. Ho 
est acceptée. Il ne semble pas y avoir de différences entre les bons 
vendeurs et les vendeurs médiocres. 
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12. 


15. 


14. 
15. 


16. 


17. 


18. 


19. 


20. 


a) Nous n'avons pas besoin de supposer l'égalité des variances. Z = 
13,07, ce qui est significatif, à quelque niveau que ce soit. La 
différence entre Nigériens et Américains est très significative. 


b) Z=-4,18. La différence entre filles et garçons est très significative. 


Nous n'avons pas besoin de supposer l'égalité des variances. |Z| = 5,91. 
Les étudiants de classe favorisée ont une moyenne significativement 
supérieure. 


|Z| = 16,26. En moyenne, les francophones ont chômé davantage. 
54 = 2,68; pi, = 2,00 ; 6 = 3,8 ; T = 1,79 ; v = 99. Avec à = 10 %, c, = 


1,66 et l'hypothèse nulle est rejetée. Avec à = 5 %, © = 1,99 et 
l'hypothèse nulle n'est pas rejetée. 


Les différences sont 4, 5, 7, 5, 2, -2, 1,3, 4,6et 4. X = 3,55 ; 6° = 
6,27 ; v = 10 ; lo = O, c, > = 2,228 ; T = 4,70. L'hypothèse (aucun effet) 
est rejetée. 


Les différences « avant-après » représentent les pertes de poids. Nous 


testons l'hypothèse que la moyenne de ces pertes est lo = 0. X = 1,833 ; 
c°=1,367 ; T=3,84. v=5; c, = 2,571. Le régime est efficace. 


ds SI0 ere Var (6 }=0 * /n : n=12. 0 =7,4; z-(5-0,)/f7/ = 0,90 ; 
c, =1,645; |Z|<c,. H,est acceptée. Rien n'indique que le fabricant ait 
menti. 

Le nombre de réclamations reçues par semaine est modélisé par une loi 
de Poisson : À, = 30,6; À = X ; Var(t)= an A sens V Ps Jr 

a) Avecn=let À = 38, Z = 1,34 ; l'écart n'est pas significatif. 

b) Avecn=4et À = 37, Z= 2,31 ; l'écart est significatif. 


Le nombre de crimes (par 1 000 habitants) est modélisé par une loi 
Poisson(À). 


A =X; Var()=/n : D =X/n. 
Pour la ville À, nx = 58, XX; = 35, À, = 85/58 = 0,603 45. Pour la ville b, 
hy.= 22,5 Y= 01; À; = 21/22 =0,95455,. 


21. 


22. 


23. 


24. 


25. 


26. 


27. 
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Re à à, J fé? /nx +85 /n, =-1514. Avec a = 5 %, 
C = 1,96; |Z|<c, ; H est acceptée. La différence entre À, et À, n'est 
pas significative. 

po = 0,515 ; p = 68/125 = 0,544 ; Z = 0,649. L'hypothèse nulle n'est pas 
rejetée. 

|Z| = 22,94. On peut certainement affirmer que le revenu moyen des 


familles dont le chef est une femme est inférieur à la moyenne des 
familles canadiennes en général. 


Po = % ; p = 24/250 = 0,096 ; n = 250 ; Z = -12,78. L'hypothèse nulle 
est catégoriquement rejetée. Le revenu médian des familles dont le chef 
est une femme est inférieur à 28 890 $. 


On teste l'hypothèse qu'avec le nouveau procédé de fabrication, p = po = 
0 055 ; p = 13/500 = 0,026 ; Z = -2,84. Le taux de défectuosité est 


effectivement inférieur à 0,055 ce qui rend le nouveau procédé plus 
avantageux que l'ancien. 


ns = 100; p; = 0,58 ;nyr= 150 ;.p; = 0,66; Z=-1,28.Avec.a= 10 %, 


Ca = 1,645. |Z] < ©, ; Ho est acceptée. Rien n'indique que les archers ne 
soient pas de même force. 


Sans supposer les variances égales, on a 


T= (a,32-3,92)/ [(1,07)° /80+(0,95)° /50 = 2,22. 


Le minimum de nx - 1 = 79 et ny - 1 = 49 est v = 49. Avec à = 5 %, une 
interpolation donne c, = 2,01. Puisque |T| > c,, Ho est rejetée. Les 
logements du quartier À contiennent en moyenne plus de pièces que 
ceux du quartier B. 


a) Sur 1 000 maisons on en a 306 qui utilisent les services d'un 
jardinier. p =0,306 ; po = O 345 ; Z = -2,59. Avec a = 5 % on rejette 
Ho. 

b) X = 8,06; Lo = 3,45 ; 6 = 2,51 ; Z=-1,55. Avec a = 5 % on ne rejette 
pas Hb. 


La solution en a) est erronée, car elle est basée sur la supposition que 
le nombre de maisons qui utilisent les services d'un jardinier suit une 
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loi B(1 000, p). Or les 1 000 essais ne sont pas indépendants : les 10 
ménages d'un même bloc ne constituent pas 10 essais indépendants. 
Si on choisit 10 ménages au hasard dans la ville entière, on s'attend à 
en trouver environ 3 qui utilisent les services d'un jardinier. On serait 
très étonné d'en trouver 8 ou 9. Mais un tel résultat n'est pas à ce 
point impossible si on choisit un bloc de 10 maisons. 


28.a) %2= 34,57 ; v = 6. L'hypothèse est rejetée. 


29. 


30. 


31. 


b) po = 0,020 3 ; p=0,018 9 ; n = 10 000 ; Z = -0,993. L'hypothèse est 


acceptée. 


C) Lo = 2,03 ; X = 1,89 ; 6” = 3,149 ; Z = -0,789. L'hypothèse est 
acceptée. 


La solution b) est incorrecte car elle est basée sur la supposition que 
les 10 000 vis constituent autant d'essais indépendants, ce qui n'est 
peut-être pas le cas, puisque les vis ont été prises dans des boîtes de 
100. Les solutions a) et c) sont correctes, mais elles ne testent pas 
exactement la même hypothèse. En c) on teste l'hypothèse que la 
moyenne n'a pas changé, hypothèse qui semble être vraie. En a) on 
teste l'hypothèse plus forte que la distribution entière n'a pas changé 
(ce qui entraîne, bien sûr, que la moyenne non plus n'a pas changé). 
Cette hypothèse, beaucoup plus forte, est visiblement fausse. 


On suppose les variances égales. 
a) |T| = 1,74. Non significatif avec à = 5 %. 


b) Pour les hommes : |T| = 2,05. Pour les femmes : | T| = 0,80. La 
différence pour les hommes est, inexplicablement, significative avec 
a = 5 %. 


On ne suppose pas l'égalité des variances. 


a) |Z| = 0,85. On ne décèle pas plus d'hostilité chez les femmes que 
chez les hommes. 


b) |Z| = 0,69. On ne décèle pas plus d'agressivité chez les hommes que 
chez les femmes. 


« Régulièrement » versus «de temps en temps» : [Z| = 9,21. 
« Régulièrement » versus « jamais » : [Z| = 13,13. « De temps en temps » 
versus « jamais » : |Z| = 5,58. Il semble bien que les habitudes de 


fréquentation de l'église aient une relation avec l'attitude. 


32. 


33 


34. 


35. 
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À cause des données groupées, les résultats suivants sont approximatifs. 


a) X = 517,299 ; 6, = 116,27 ; Y = 505 762 ; 6 


9,88. Les Orientaux ont une moyenne supérieure. 


= 113,01 ; |[Z| = 


X Y 


b) En utilisant By = 116,27, |Z| = 9,97. En utilisant 6 = 113,01ona 


|Z| = 10,26. Dans les deux cas, on considère les 502 990 Blancs 
comme une population. Lorsqu'on utilise 6 = 113,01 on suppose, en 
outre, que la variance de la population d'Orientaux est égale à celle 
de la « population » formée des 502 990 Blancs. Si les deux valeurs de 
|Z| sont très proches, c'est parce que, vraisemblablement, ces deux 
variances sont à peu près égales. 


c) Les tests en b) sont incorrects car ils supposent que la moyenne pour 
les Blancs est connue (et vaut 505 762) alors qu'en fait elle est 
inconnue et doit être estimée. La valeur 505 762 est une estimation 
sujette à erreur. Cependant, l'échantillon est si grand que l'erreur 
d'estimation est minuscule. 


.Statisticien X : y2 = 13,85 avec 6 degrés de liberté, significatif. 


Statisticien Y : p, = 0,020 3, p, = 0,018 9. Z = 0,714, non significatif. 
Statisticien Z : X = 2,08, 6, = 2,029 4, X = 1,89, 6; = 3,149 4. Z = 
0,615, non significatif. La procédure utilisée par le statisticien Y est 
incorrecte. 


Le nombre X de points obtenus en lançant n dés est approximativement 
N7n/2; 35n/12). n = 2X/7 est approximativement Mn, 5n/21). 
o=5n/21. I, X= 77; Y=114;h, = 22, ñ, =82,57; se = 5,238 ; 
de. ii Ze (Gi, -5,)/ lS, +65, =-2,93; ce, =19%6; H, est 
rejetée. nx et ny ne sont pas égaux. 
a) nx=11; XY =252/11 = 22,909 ; 6° = 11,09 ; ny = 11. Ÿ = 22,545 ; 
6; = 17,07; 6° = 14,08. 
T=0,23 ; v=20 ; c,= 1,725 ; Ho est acceptée. 
b) nx= 11; X =297/11=-27; 06; = 17; nv=11;} = 22,636 ; 6; = 
11,45 : 6° = 14,93: 
T=2,71;v=20;c,= 1,725 ; H est rejetée. 
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C) 


Les augmentations de scores sont 

13, 4, 2, -1, 4, 7,2, -1, 7, 7, 1 pour le groupe LOGO ; 

6, 4, 0, -2, -2, -2, O, 7, -5, -2, -3 pour le groupe Delta Drawing. 

nx = 11; X = 45/11 = 4,091 ; 6: = 17,49 ; ny = 11 ; Y = 0,091 ; 
6, = 15,09 ; 6° = 16,29. 

T=2,32;v=20; c,= 1,725 ; H est rejetée. 

Pour le groupe LOGO, n = 11 ; W = 4,091 ; 6. = 17,49 ; T = 3,24 ; 
v=10; c = 1,812. Ho : uw = 0 est rejetée. 

Pour le groupe Delta Drawing, n = 11; W = 0,091 ; œ. =15,09 ; T = 
0,08 ; v = 10 ; c, = 1,812. Ho : nw = O est acceptée. 

Pour le groupe LOGO, nx = 6 (filles) ; À = 5,333 ; 6; = 23,47 ; ny=5 
(garçons) ; Ÿ = 2,6 ; ae 20920 21214 7T= L095ve0:e 
1,833 ; Ho est acceptée. 

Pour le groupe Delta Drawing, nx -7 ; D'OR as =]5inv=4ir = 
HS So = 16.6 = TT = L086-v= 00e 1888 s'Hiest 


acceptée. 


36. Personnes qui ont vécu des épisodes d'ischémie silencieuse : nx = 30, 
X=9,p, =0,53. 


Personnes qui n'ont pas vécu d'épisodes d'ischémie silencieuse : ny = 73, 
Y=8, Ds = 0,109 6 ; Z = 2,09. Au niveau a = 0,05, la différence peut être 


déclarée significative. 


37.a) P(B|A) est estimée par p, = 0,235 3. P(B|AJ est estimée par 


p, = 0,042 6. 
G- . =0,004 3949; 
Px-Py 


Z=(p, -p, 6 5,2, — (0,285 3 - 0,042 6)/0,066 29 = 2,91. 


Il y a donc une différence significative. L'hypothèse que P(B]|A) = 
P(B| A9 est rejetée. 


38. 


39. 


40. 


41. 


42. 
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GROUPE TÉMOIN : nx = 11 000, X = 189, p, = 0,017 181 8. 
GROUPE EXPÉRIMENTAL : ny = 11 O00, Y = 104, De = 0,009 454 5. 


6? . =2,3865 x 105:6. . = 0,001 548 8 ; Z= 4,99. 
Y PrTPY 


PxP 


La différence est hautement significative. Il semble bien que l'aspirine 
réduit les chances d'une crise cardiaque. 


Épouses des hommes : nx = 25, X = 10, P, 04, Époux des femmes : 

ny = 55, Y = 2, De = 0,036 36. 5; LA 0, 101 2 ; Z = 3,59. On peut 
X F 

conclure que la probabilité qu'un homme transmette le virus à sa femme 

est supérieure à la probabilité qu'une femme transmette le virus à son 

mari. 

Ho : p = 0,6. Avec a = 5 %, Ho sera rejetée si | p - 0,6| > 1,964/0,24/20, 


c'est-à-dire si X est hors de l'intervalle (7,7 ; 16,3) que la correction pour 
la continuité ramène à (7,5 ; 16,5). En fonction de p, la probabilité de 


rejeter Ho est donc 1- P[(7,5 _20p)/4/20 pq < N(0,1)<(16,5-20p)/./20 pq ] 
a) Sip= 0,55, on trouve 1 - P(-1,573 1 < M0, 1) < 2,472 1) = 0,064 7. 


b) Pour p = 0,56, 0,57, 0,58, 0,59 et 0,60, les probabilités de rejeter Ho 
sont, respectivement, 0,056 3, 0,049 7, 0,044 8, 0,041 6 et 0,040 O. 


c) Un échantillon de taille 20 est trop petit pour détecter efficacement 
des différences aussi minimes dans la valeur de p. 


a) X est MNu,32) et Ho est rejetée si X est hors de l'intervalle (28,91 ; 
51,09). Si u = 42, cette probabilité n'est que 0,064 4. 

b) En négligeant la queue de gauche, il faut centrer 1 à la borne de 
droite de l'intervalle, c'est-à-dire, avoir up = 51,09. (et ô = 11,09). 

c) Ho est rejetée si X est hors de l'intervalle (40 - 31,36/ Vn , 40 + 
31,36/ Vn). En négligeant la queue de gauche, il faut centrer un à la 
borne de droite, c'est-à-dire, prendre à = 31,36/ Vn. Si Ô = 2, on 
trouve n = 246. 

a) Les différences avant-après sont : -2, 6, 6, 5, -1, 8, 4, 1, 7, 6, -1, 4, 1, 


7: .W = 3,649, 6° = 11.478, T = 4,02. On peut conclure que les 
réflexes ralentissent après une faible consommation d'alcool. 
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b) 


43. a) 


44. a) 


b) 


i) L'hypothèse que l'alcool n'a pas d'effet est Ho : p = 1/2. 
ii) U= 11, p = 0, 785 7, Z = 2,14. On conclut encore que l'alcool 


ralentit les réflexes. 


W =3,5,6  =12,5769 ; T= 3,69. On rejette encore Ho. Par contre, 
U = 10, p = 0,714 3, Z = 1,60. Le remplacement des nombres par de 
simples signes (positif, négatif) entraîne une perte d'information qui 
« affaiblit » le test. 

Les augmentations de scores sont 3, 5, -1, 2, 2, -1, 2, 4, -3, 3, 2, 6, 2, 
1, W =1,7857, 6 = 6,335 2 ; T= 9,65, L'augmentation des scores 
est significative. 


Groupe témoin : > 26,928 6, c: = 88,225 3. 


Groupe expérimental : Ÿ = 28,714 3, 6° = 85,450 5, 6° = 86,837 9, 
T=-0,507. 


L'écart-type de W est estimé à (ES | n = 16,335 2 / Jia =0,6727 dans 


le premier modèle et à © /1/n, +1/n, =3,522 1 dans le second. 


Voici, dans l'ordre, les 22 scores et une indication du groupe : L = 
LOGO, D = Delta Drawing. 


19 20 20 21 21 21 21 22 23 23 23 24 25 26 26 27 29 29 30 30 32 34 


Médiane 


D D D EL D D D DLL DE DL EL D LOL L D L 


Nous obtenons le tableau suivant : 


Supérieur à la médiane Inférieur à la médiane TOTAL 
LOGO 8 3 11 
Delta Drawing 3 8 11 


TOTAL 11 11 22 


c) 


45. a) 


46. a) 


Chapitre 9 : Réponses aux exercices 447 


Le test d'indépendance teste l'hypothèse que la probabilité qu'un 
sujet soit supérieur à la médiane est la même pour les deux groupes - 
ce qui est une façon d'exprimer l'absence de différence entre les deux 
types d'expérience. La valeur du Kkhi-deux est y? = 4,55, ce qui est 
significatif. La conclusion est que le LOGO a tendance à donner des 
résultats supérieurs à ceux du Delta Drawing. 


Groupe qui n'a pas suivi le cours de sensibilisation : X = 53, 
6, = 24. 


Groupe qui a suivi le cours de sensibilisation ; Y = 43, 6; = 24. 


T = 4,08. Pour le policier avec 11 ans de scolarité ou moins, il y a une 
différence significative entre ceux qui ont suivi et ceux qui n'ont pas 
suivi le cours. 


L de ire n ea A 2 
Groupe qui n'a pas suivi le cours de sensibilisation : X# = 31, 6, = 


15,714 3. 


Groupe qui a suivi le cours de sensibilisation Y = 25,5, D 1 
11,142 9. 


2 


6 = 13,428 6 ; T = 3,00. Pour le policier avec plus de 11 ans de 
scolarité, il y a une différence significative entre ceux qui ont suivi et 
ceux qui n'ont pas suivi le cours. 


Groupe qui n'a pas suivi le cours de sensibilisation : X = 42, e 
147,6. 


Groupe qui a suivi le cours de sensibilisation : Ÿ = 34,25, 6 
98,066 7, 6 = 122,83 ; T = 1,98, v = 30 ; avec a = 5 %, ©, = 2,042. La 
différence n'est plus significative (de justesse). 


i) 0,048 8. ïi) 0,019 8. On préfère le test pour lequel la probabilité de 
rejeter Ho lorsque Ho est vraie est petite, donc le test 2. 


Si le test 2 donne une faible chance de rejeter Ho quand ÆH est vraie, 
il donne également une faible chance de rejeter lorsque Ho est fausse. 


i) PX < a[0 = 10) = 0,05 = 1 - e-2/10 = 0,05 = a = -10 log 0,95 = 
0,512 9. 


ii) a = - 10 log(0,99) = 0, 100 5. äii) a = -10 log(0,995) = 0,050 1. 
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47.a) Si Ho est vraie, alors X est de loi de Poisson avec À = 1 et Y est de loi 
de Poisson avec À = 2. 


i) PX 2 4]X = 1) = 0,019 O. 
ii) P(Y > 6] = 2) = 0,016 6. 
Avec la procédure 2 la probabilité de rejeter H est plus faible lorsque 


H est vraie et plus forte lorsque H est fausse. C'est précisément ce 


qu'on souhaite. Ceci reflète bien sûr, le fait que la procédure 2 est 
basée sur deux observations au lieu d'une. 


CHAPITRE 10 


1. à n=5,5;0o =7,916 667. 


c) La distribution de X est donnée par : 


4 2 3 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 


p(x) 1/15 1/15 2/15 1/15 2/15 1/15 2/15 1/15 1/15 1/15 1/15 1/15 


e) 6 =3,166 7. 
X 


La distribution de 6° est 
ÿ) 


0,5 2 4,5 8 18 12,5 24,5 32 


22 
[e} 
rlé°) 2/15 4/15 1/15 3/15 2/15 1/15 1/15 1/15 


E(6*)-9,5. Donc £(6° )- Ef*/n(1-n/N)|- £(6°/3)- 3.166 66 - 0°. 


2. Plus N'est grand, moins grande est la précision ; mais pour des valeurs 
de N beaucoup plus grandes que n, la perte de précision ne se fait plus 
sentir. 


3. Wi = 0,522 691 7 ; W2 = 0,190 923 3 ; Was = 0,286 385 ; ji, = 3,681 8 ; 
hi, = 56; à, = 384; 6; = 2,608 2 ; 6, = 687 14; 6; = 45 622. 
a) à =122,59. b) rt =391675. c) 17,63. d) 56 328. 


e) 88,03<u<157,14. f) 281 256 < 71 < 502 088. 
g) Les effectifs optimaux sont 1, 3, 38. h) 10,168. 
4. m%10, mz=26et ns = 64. 
a) Les tailles des échantillons sont 21, 23, 33, 40 et 63. 


b) L'allocation proportionnelle est à peu près m +5, mMr+9,n3 +32, m% 
47, ns * 88. L'écart-type de hi est 1,219 pour l'allocation 


proportionnelle et 1,015 pour l'allocation optimale. 
6. a) p = 0,633 341 2 ; Var( p) = 0,000 682 ; l'écart-type de p est 0,026 12. 


b) (0,582 15 : 0,684 54]. c) t =9 329. d)8575<7t< 10 088. 
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10. 


e) La variance estimée est 0,000 774 1 ; l'écart-type serait donc 
0,027 82. On voit donc que cette stratification n'est que légèrement 
plus efficace qu'un échantillon aléatoire simple. 

f) Répartition optimale n1 = 23, n2 = 62, na = 34, nr = 181. La variance 
est estimée à 0,025 78. 

g) 479. 

a) un =2081,14 b)T = 10093514 c)9044160<71< 11 142 868. 

d) rm1r729,n =33,ns=23. e) 82,098. 

a) Les valeurs de X sont 4,5:3,5:3:2,5:4:4:35:3:4,5; 3,5. 

b) Chacune des valeurs ci-dessus se réalise avec probabilité 1/10. E(X) 
= 3,60, ce qui montre que X est sans biais puisque 3,60 est la 
moyenne de la population. 

c) Var X)= 0,39. 

rm = M = 50, nr = 36, n3 =165, n4= 248. La variance de H est estimée à 

0,020 68. 

a) 

P 0 0,2 0,4 0,6 0,8 1 
Probabilité 0 5/17 5/17 4117 3/17 0 
E(p) = 39/85 = p; Var bp) = 0,046 ; écart-type de p = 0,214. 
b) 
P 0 0,2 0,4 0,6 0,8 1 
Probabilité 1/17 1/17 5/17 6/17 3/17 1/17 
E(p) = 46/85 = p; Var bp) = 0,055 ; écart-type de p = 0,235. 
C) 


P (0) 0,2 0,4 0,6 0,8 1 


Probabilité 4/17 C'AN 7117 1/17 1/17 0 


E(p) = 25/85 = p; Var p) = 0,048 ; écart-type de p = 0,218. 


11. 


12. 
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Écarts-type de p : Proportion d'enfants : 0,216. Proportion de 


personnes de sexe féminin : 0,216. Proportion d'adultes de sexe 


féminin : 0,198. 


P 0 0,8 1 
Probabilité 9/17 1/17 7117 
Var( p) = 0,239; écart-type de p = 0,489. 
P 0 0,2 0,8 1 

Probabilité 5/17 3/17 2117 7117 
Var( p) = 0,201 ; écart-type de p = 0,448. 

P 0 0,2 0,8 1 
Probabilité 11/17 1/17 1/17 4/17 
Var( p) = 0,189 ; écart-type de p = 0,434. 

P 0 1/6 2/6 3/6 4/6 5/6 6/6 


Probabilité 0,031 26  0,17316  0,34013  0,30234 0,127 55 


0,024 01 0,001 56 


E(p) = 0, 400 0. 
5; = 0,033 11. 


# A2 
La fonction de masse de © A est 


22 
QE 0 5/225 8/225 


9/225 


Probabilité 0,032 82 0,197 17 0,467 68 


0,302 34 


On calcule à partir de ce tableau E(6 ;) = 0,033 10, ce qui coïncide 


avec la valeur connue de 


Ge = (pq/n)((N - n)/(N - 1)) = ((0,4)(0,6)/6)/(24/29) = 0,033 10. 


CHAPITRE 11 


1. 


b) 


11 


83 462, 85 884, 91 229, 99 758, 124 369, …, 105 965, 111 873. 
89 637, 82 538, 82 725, 95 383, 119 038, …, 108 610, 126 706. 

104 111, 93 304, 87 064, 89 093, 96 931, …, 98 745, 116 529. 

À, =2X, -X,, = 134 313. 

249 688, 244 608, 239 926, 258 534, 306 440, …, 369 117, 374 054. 
249 365, 249 850, 239 123, 245 850, 273 219, …, 374 762, 375 245. 
À, =2x%,-x, = 375 728. 


=4662;x,, = 4041; À,, = 3 420. 


Chaque donnée est divisée par 127,2/100. On trouve 19,8 ; 21,9 ; 22,4 ; 


a) 
©) 
) 
) 


©) 


D 


(Cx 


96,1 ; 100,0 ; 104,1 ; 108,6. 
86,5%. b) 127 470 $. 

36,0 % : 35,0 % ; 7,0 % : 10,8 % : 8,0 % ; 4,9 % ; 8,4 %. 

1,078 1 ; 1,077 4 ; 1,078 7 ; 1,077 5 ; … ; 1,365 2 : 1,389 5 ;: 1,326 1. 
13,70 ; 13,84 ; 18,64 ; 11,85 ; … : 11,55 ; 10,14 : 9,84. 


En 1965 : 0,357 7 & ; 4,900 2 F ; 3,994 3 DM ; 359,95 Y ; 1,078 1 $ 
can. En 1985 : 0,771 2 & ; 8,905 4 F ; 2,918 9 DM ; 236,724 # ; 
1,365 2 $ can. 


En 1966, le plus : dollar US, -0,065 % ; le moins : franc, -1,187 %. 
En 1967, le plus : mark, 0,446 % ; le moins : livre, -1,453 %. 
En 1987, le plus : mark, 14,923 % ; le moins : dollar US, -4,562 %. 


Il a acheté 4 338,12 DM et les a revendus 13 314,7 F. Investissement 
de 3 ans rapportant 10,01 % par année. 


4,0 ; 5,0 ; 5,6 ; 8,0 ; 28,8 ; … ; 53,5 ; 56,7. 
23,9 ; 28,9 ; 30,8 ; 41,2 ; 132,8 ; ….; 98,4 ; 100,0. 


En monnaie américaine : 28,9 % ; 13,8 % ; 42,4 % ; 266,0 % ; …; 
-54,7 % ; 11,1 %. 


10. 


11. 


12. 
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En monnaie canadienne : 24,7 % ; 11,6 % ; 43,8 % ; 257,9 % ; …; 
-53,9 % ; 6,0 %. 
117,8 ; 80,6 ; 95,6 ; 177 ; 326,5 ;, 325. D) ; = 187,1. 
-69,3 ; -106,5 ; -91,5 ; -10,1 ; 139,4 ; 137,9. 


211,3 ; 195,5 ; 186,5 ; 186,1 ; 176,6 ; 200,1 ; .…; 197,1 ; 199,3 ; 
176,5 ; 193,5. 


Pour la température : -16,25 ; -15,25 ; -9,25 ; -0,25 ; 6,75 ; 11,75 ; 
14,75 ; 13,75 ; 8,75 ; 2,75 ; -4,25 ; -13,25. 


Pour les précipitations : -6,9 ; -13,9 ; -4,9 ; -4,9 ; -12,9 ; 3,1 ; 11,1 ; 
13,1:29:1.;:-2;5959;1:8;1;. 


De 1951 à 1980, il y eu 8 années bissextiles. Février avait donc, en 
moyenne, 28,267 jours. 


2,32 ; 2,30 ; 2,39 ; 2,47 ; 2,13 ; 2,73 ; 2,90 ; 2,97 ; 2,93 ; 2,45 ; 2,70 ; 
2,81. 


Huile : à = 22,06 ; b = 1,723 ; prédictions : 41,0 ; 49,6 ; 58,2. 

Gaz : â= 11,32 ; b = 1,179 ; prédictions : 24,3 ; 30,2 ; 36,1. 
Électricité : 4 = 3,10 ; b = 0,304 ; prédictions : 6,4 ; 8,0 ; 9,5. 

Huile : à = 33,62 ; b = 0,304 ; prédictions : 37,0 ; 38,5; 40,0. 

Gaz : â = 17,90 ; b = 0,353 ; prédictions : 21,8 ; 23,5 ; 25,3. 
Électricité : à = 4,99 ; b = 0,058 ; prédictions : 5,6 ; 5,9 ; 6,2. 

1991 : 28 123 ; 10 178 ; 7 424 ; 3 430 ; 3 682 ; 1 516 ; 864 ; 672. 
2001 : 31 556 ; 11 532 ; 8 216 ; 3 869 ; 4274 ; 1 746 ; 1 000 ; 768. 


Sauf pour la ville de Québec, l'accroissement est de plus en plus lent 
et le modèle linéaire mène à des prédictions trop grandes. 


1991 : 30 205 ; 11 164 ; 7 849 ; 3 775 ; 4 328 ; 1 723 ; 998 ; 743. 
2001 : 36 253 ; 13 770 ; 9 139 ; 4 629 ; 5 790 ; 2 231 ; 1 318 ; 936. 


Dans tous les cas, le taux d'accroissements est de plus en plus lent. 
Le modèle exponentiel, qui suppose un taux d'accroissement 
constant, mène à des prédictions beaucoup trop grandes. 
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15. 


14. 


15. 


16. 


a) Dette totale, prédictions : 500 924 ; 1 327 178 ; 3 516 305. 
Dette per capita, prédictions : 19 042 ; 48 367 ; 122 860. 

b) Dette totale, prédictions : 406 819 ; 802 861 ; 1 584 455. 
Dette per capita, prédictions : 15 465 ; 29 260 ; 55 361. 


Les résidus D: s'obtiennent en soustrayant x = 6,6 à chacune des 
valeurs désaisonnalisées paraissant au tableau 11.8. 
Les 98 résidus sont -0,4 ; -0,3 ; -0,3 ; 0,2 ; O,1 ; …; 0,3 ; 0,5 ; 0,4 ; -0,2 ; 


-0,4 ; -0,4. 
Posant n = 97, Xi= Diet Yi= Din, on trouve XX; = -0,7 - Dog = -0,8 ; XYi= 
-0,7 - Di = -0,8 ; ZX° = 54,49 - D, = 54,33 ; XY° = 54,49 - D° = 


il 
54,33 ; EXiYi = 48,22 ; r = 0,887 5 et Z = 18,77. Les résidus ne sont pas 
un bruit blanc. 


Chacune des 38 données est remplacée par son logarithme. 

à = 2,930 8 ; b = 0,049 018. Les résidus sont 

0,247 0,300 0,272 0,216 0,174 0,125 0,090 0,072 0,049 
0,013 -0,023 -0,063 -0,102 -0,133  -0,164  -0,189 -0,203  -0,216 
-0,225  -0,230 -0,247  -0,267  -0,270 -0,244  -0,0,190 -0,136  -0,113 
-0,085  -0,050 -0,011 0,037 0,106 0,159 0,166 0,160 0,150 
0,141 0,135 0,126 0,125 0,123 0,128 0,095 0,063 0,017 
-0,011 -0,044  -0,077 


XD: = 0; ED? = 1,197 3 ; XDiDm= 1,138 6. r = 0,980 ; Z = 33,07. Les 


résidus ne sont pas un bruit blanc. Une tendance exponentielle implique 
un taux d'accroissement constant. Les résidus sont systématiquement 
59 positifs jusqu'en 1959 ; puis systématiquement négatifs jusqu’en 
1979 ; puis positifs encore jusqu’en 1994 ; et enfin négatifs à nouveau 
durant les dernières années. Il est donc évident que le taux 
d’accroissement a changé plusieurs fois au cours de la période 
considérée. 


Les résidus sont 24,2 ; 8,4 ; -0,6 ; -1,0 ; -10,5 ; .….; 12,2 ; -10,6 ; 6,4. 
ZDi=0 ; XD? =4 172,2 ; ZDiDu = -1 088,2 ; n = 26. 


17. 


18. 
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r = -0,285 2 ; Z=- 1,46. Il n'y a pas de corrélation significative entre les 
résidus consécutifs. Ils semblent former un bruit blanc. 


a) 


Café : 71,1 ; 60,2 ; 65,8 ; 76,4 ; ….; 67,9 ; 84,9 ; 51,6. 

Thé : 104,0 ; 96,2 ; 93,2 ; 88,1 ; ….; 68,2 ; 65,1 ; 55,5. 
Sucre : 53,1 ; 53,7 ; 55,9 ; 63,6 ; .….; 51,9 ; 52,5 ; 52,7. 
Argent : 18,3 ; 15,3 ; 16,2 ; 23,0 ; .….; 22,8 ; 20,0 ; 24,7. 
Cuivre : 137,1 ; 100,7 ; 96,5 ; 150,8 ; …; 49,7 ; 47,1 ; 81,4. 
Café : le plus cher en 1977 (206,6) ; le moins cher en 1987 (51,6). 
Thé : 1977 (164,0) ; 1987 (55,5). 

sucre : 1974 (164,1) ; 1977 (49,7). 

Argent : 1980 (100,0) ; 1971 (15,3). 

Cuivre : 1974 (157,2) ; 1986 (47,1). 

Café : 1976 (+85,2 %) ; 1987 (-39,2 %) 

Thé : 1977 (+64,2 L) ; 1985 (-44,6 %). 

Sucre : 1974 (+158,0 %) ; 1976 (-44,0 %). 

Argent : 1979 (+84,8 %) ; 1981 (-53,7 %). 

Cuivre : 1987 (+72,8 %) ; 1975 (-44,9 %). 

Transformation logarithmique. à = 6,978 4; b= 0,027 O2. 


Résidus : 0,124 ; 0,651 ; -0,607 ; -0,141 ; 0,036 ; 0,033 ; -0,231 ; 
0,337 ; -0,236 ; 0,138 ; -0,528 ; 0,061 ; -0,028 ; 0,354 ; -0,266 ; 
0,125 ; 0,175 ; 0,401 ; -0,471 ; 0,078. 

Période k = 4. Les effets de phase sont 0,014 ; 0,315 ; -0,421 ; 0,091. 
Les résidus désaisonnalisés sont 0,110 ; 0,336 ; -0,187 ; -0,232 ; 
0,022 ; -0,283 ; 0,189 ; 0,246 ; -0,250 ; -0,178 ; -0,107 ; -0,030 ; 
-0,042 ; 0,039 ; 0,155 ; 0,034 ; 0,161 ; 0,086 ; -0,050 ; -0,018. 
>Di=0 ; 2D° = 0,561 25 ; >DiD41, = 0,0314 9. r = 0,057 O ; 
Z = 0,235 2. Les résidus désaisonnalisés semblent former un bruit 
blanc. 


Le logarithme de la prédiction pour le temps t& est à + bt PES ; où x . 


est l'effet de phase correspondant à to. 
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Pour l'année 6, on prend & = 21, 22, 23 et 24. Les prédictions sont : 
1 920 ; 2 666 ; 1 312 et 2 248. 


Pour l'année 7, on prend & = 25, 26, 27 et 28. Les prédictions sont : 
2 139 ; 2 970 ; 1 462 et 2 504. 


A 

Ajustement, 15 

Allocation, 328 
optimale, 329, 334 
proportionnelle, 329, 
334 

Approximation 
de la loi binomiale par la 
loi de 

Poisson, 200 

normale, 233 


B 

Biais, 254 

Binôme de Newton, 183 
Binomiale, loi, 185 
Bruit blanc, 376 


C 
Caractères, 2 
Causalité, 85 
Cause et effet, 83 
Centiles, 41 
Charnières, 55 
Chronologique, série, 349 
Classe modale, 48 
Coefficient de corrélation, 
118, 124 
Combinaisons, 183 
Complément, 146 
Conditions de validité, 123 
Confiance 
intervalle de, 256, 261 
niveau de, 256 
Correction pour la continuité, 
234 
facteur de, 320 
Corrélation, 118 
coefficient de, 118, 124 
négative, 119 
positive, 119 


INDEX 


ote Z, 60 


D 
Déciles, 41 
Degrés de liberté, 18, 265 
Densité, fonction de, 217 
Dépendance, 82 
et causalité, 85 
Désaisonnalisation, 367 
Diagramme à bâtons, 9 
Différence, 146 
Dispersion, 38, 42 
Distance, 113 
Distribution, 4-9 
conditionnnelle, 81, 88 
conjointe, 79 
d'une moyenne, 236 
marginale, 80 
moyenne d'une, 51 
variance d'une, 52 
Donnes appariées 
moyennes, 291 
proportions, 282 
Droite 
de régression, 115 
des moindres carrés, 
111,115, 124 


E 
Écart interquartile, 47 
Écart-type, 43 
d'une variable aléatoire, 
166 
Échantillon, 14, 253 
espace, 144 
Échantillonnage 
aléatoire simple, 317 
d'une population finie, 
318-23 
en grappes, 337 
stratifié, 323 


systématique, 335 


taux d', 320 
Effectif, 6 
observé, 17 


théorique, 17, 19, 89 
total, 6 
Effets de phase, 368 
Équation linéaire, 111 
Espace échantillon, 144 
Espérance mathématique, 
165 
Estimateur, 253, 277 
sans biais, 254 
Estimation 
de la variance, 263 
d'une moyenne, 262, 
319, 323 
d'une proportion, 257, 
331 
d'un paramètre @ 
quelconque, 266 
d'un total, 323 
par intervalle de 
confiance, 255 
ponctuelle, 254 
Événement, 145 
certain, 146 
dépendant,158 
impossible, 146 
incompatible, 154 
indépendant, 155 
Exponentielle 
lissage, 355, 358 
loi, 223 


F 
Facteur de correction, 320 
Factorielle, 182-3 
Fonction de 

densité, 217 
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Fonction de 
masse, 163 
Fraction d'échantillonnage, 
320 
Fréquence(s), 6 
observée, 88 
polygone des, 12 


G 

Géométrique, loi, 197 
Graphiques, représentations, 
9-14 

Grappes, 337 

Groupement des valeurs, 7 


H 
Histogramme, 9-10 
Hypergéométrique, loi, 194 
Hypothèse, 
d'indépendance, 122 
nulle, 16-22 
test d', 19, 284-86 


L 
Laplace-Gauss, loi de, 225 
Liberté, degrés de, 18, 265 
Limite central, théorème, 231 
Linéaire 
équation, 111 
régression, 370 
transformation, 58, 230 
Lissage, 350 
exponentiel, 355, 358 
Logarithmique, 
transformation, 373 
Loi 
binomiale, 185 
de Laplace-Gauss, 225 
de Poisson, 199 
de Student, 264, 284 
exponentielle, 223 
géométrique, 197 
hypergéométrique, 194 
normale, 225 
uniforme, 222 


N 

Newton, binôme de, 183 
Niveau de confiance, 256 
Nombres indices, 362 
Normale, loi, 225 

Nuage de points, 111 


O 
Optimale, allocation, 329, 
334 


I 
Indépendance, 83-85, 121 
hypothèse d', 122 
test d', 121 
Indices, 362 
Inertie, 357 
Inflation, taux d', 364 
Interpolation, 49 
Interquartile, écart, 47 
Intersection, 146 
Intervalle de confiance, 256, 
261 
estimation par, 255 
rayon d'un, 260 


K 
Khi-deux, 17 


M 
Masse, fonction de, 163 
Médiane, 41, 49 
Mode, 39, 48 
Modèle, 145 
uniforme, 151 
Modélisation, 145 
Moindres carrés, droite des, 
111,115, 124 
Moustaches, 54, 57 
Moyenne, 38, 51-52 
ajustée, 63 
distribution d'une, 236 
d'une distribution, 51 
estimation d'une, 262, 
319, 323 
mobile, 351 
pondérée, 62 
test d'hypothèse sur une, 
284 


P 
Permutations, 183 
Phase, 368 
Point critique, 18 
Poisson, loi de, 199 
Polygone des fréquences, 12 
Pondération, 63, 64 
Population, 2 
finie, 318-23 
Prédiction, 358 
Probabilité, 150 
conditionnelle, 159 
Proportion 
estimation d'une, 257, 
331 
test d'hypothèse sur une, 
278 
Proportionnelle, allocation, 
329, 334 


Q 
Quantiles, 41, 49 
Quartiles, 41 


R 
Rayon d'un intervalle de 
confiance, 260 
Régression 
droite de, 115 
linaire, 370 
Représentations graphiques, 
9-14 
Résidus, 376 
Résultat, 150 
Réunion, 146 


Index 


Test 

sur un paramètre 0 

quelconque, 293 
Théorème 

limite central, 231 

de Tchebychev, 61 
Total, estimation d'un, 323 
Transformation 

linéaire, 58, 230 

logarithmique, 373 


Risque d'erreur, 124, 277 U 
Uniforme 

S loi, 222 

Série chronologique, 349 modèle, 151 
désaisonnalisée, 367 Unités 

Strates, 323 primaires, 337 
recensées, 331 secondaires, 337 

Student, loi de, 264, 284 statistiques, 2 

T V 

Taux Valeurs, 2 


d'échantillonnage, 320 
d'inflation, 364 
Tchebychev, théorème de, 61 
Tendance 
centrale, 38 
générale, 370 
Test 
d'ajustement, 15 
d'hypothèse, 19, 284-85 
région d'acceptation, 
277 
risque d'erreur, 277 
sur une moyenne, 
284 
sur une proportion, 
278 
d'indépendance, 121 
sur l'égalité de deux 
moyennes, 286 
variances égales, 
288 
sur l'égalité de deux 
proportions, 280 


groupement des, 7 
Validité, conditions de, 123 
Variable, 2 

aléatoire, 163, 165, 168 

écart-type d'une, 166 
variance d'une, 166 

centrée réduite, 59 

continue, 4, 7 

dépendante, 82-83, 117 

discrète, 4 

explicative, 117 

expliquée, 117 

indépendante, 83, 117, 

168 

qualitative, 3 

quantitative, 3 
Variance, 43, 45, 52-54 

d'une distribution, 52 

d'une variable aléatoire, 

166 

estimation de la, 263 
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